Untuk mengurangi penyalahgunaan dan mengelola kapasitas pada API kami, kami telah menerapkan batas pada seberapa banyak organisasi dapat menggunakan Claude API.
Tingkat Penggunaan | Pembelian Kredit | Penggunaan Maks per Bulan |
---|---|---|
Tingkat 1 | $5 | $100 |
Tingkat 2 | $40 | $500 |
Tingkat 3 | $200 | $1,000 |
Tingkat 4 | $400 | $5,000 |
Penagihan Bulanan | N/A | N/A |
retry-after
yang menunjukkan berapa lama harus menunggu.
input_tokens
dan cache_creation_input_tokens
terhadap batas tarif ITPM.
cache_read_input_tokens
juga dihitung terhadap batas tarif ITPM. ITPM maksimum untuk model ini ditandai dengan † dalam tabel batas tarif di bawah ini.Untuk semua model lainnya, cache_read_input_tokens
tidak dihitung terhadap batas tarif ITPM (meskipun masih ditagih).max_tokens
pada awal setiap permintaan, dan perkiraan disesuaikan pada akhir permintaan untuk mencerminkan jumlah sebenarnya token output yang digunakan.
Jika Anda mencapai batas OTPM lebih awal dari yang diharapkan, coba kurangi max_tokens
untuk lebih memperkirakan ukuran penyelesaian Anda.
Batas tarif diterapkan secara terpisah untuk setiap model; oleh karena itu Anda dapat menggunakan model yang berbeda hingga batas masing-masing secara bersamaan.
Anda dapat memeriksa batas tarif dan perilaku saat ini di Anthropic Console.
context-1m-2025-08-07
dengan Claude Sonnet 4, batas tarif terpisah berlaku. Lihat Batas tarif konteks panjang di bawah ini.Model | Permintaan maksimum per menit (RPM) | Token input maksimum per menit (ITPM) | Token output maksimum per menit (OTPM) |
---|---|---|---|
Claude Opus 4.x* | 50 | 30,000 | 8,000 |
Claude Sonnet 4 | 50 | 30,000 | 8,000 |
Claude Sonnet 3.7 | 50 | 20,000 | 8,000 |
Claude Sonnet 3.5 2024-10-22 (deprecated) | 50 | 40,000† | 8,000 |
Claude Sonnet 3.5 2024-06-20 (deprecated) | 50 | 40,000† | 8,000 |
Claude Haiku 3.5 | 50 | 50,000† | 10,000 |
Claude Opus 3 (deprecated) | 50 | 20,000† | 4,000 |
Claude Haiku 3 | 50 | 50,000† | 10,000 |
cache_read_input_tokens
terhadap penggunaan ITPM.
Permintaan maksimum per menit (RPM) | Permintaan batch maksimum dalam antrian pemrosesan | Permintaan batch maksimum per batch |
---|---|---|
50 | 100,000 | 100,000 |
Token input maksimum per menit (ITPM) | Token output maksimum per menit (OTPM) |
---|---|
1,000,000 | 200,000 |
Header | Deskripsi |
---|---|
retry-after | Jumlah detik untuk menunggu sampai Anda dapat mencoba ulang permintaan. Percobaan ulang lebih awal akan gagal. |
anthropic-ratelimit-requests-limit | Jumlah maksimum permintaan yang diizinkan dalam periode batas tarif apa pun. |
anthropic-ratelimit-requests-remaining | Jumlah permintaan yang tersisa sebelum dibatasi tarif. |
anthropic-ratelimit-requests-reset | Waktu ketika batas tarif permintaan akan diisi ulang sepenuhnya, disediakan dalam format RFC 3339. |
anthropic-ratelimit-tokens-limit | Jumlah maksimum token yang diizinkan dalam periode batas tarif apa pun. |
anthropic-ratelimit-tokens-remaining | Jumlah token yang tersisa (dibulatkan ke ribuan terdekat) sebelum dibatasi tarif. |
anthropic-ratelimit-tokens-reset | Waktu ketika batas tarif token akan diisi ulang sepenuhnya, disediakan dalam format RFC 3339. |
anthropic-ratelimit-input-tokens-limit | Jumlah maksim token input yang diizinkan dalam periode batas tarif apa pun. |
anthropic-ratelimit-input-tokens-remaining | Jumlah token input yang tersisa (dibulatkan ke ribuan terdekat) sebelum dibatasi tarif. |
anthropic-ratelimit-input-tokens-reset | Waktu ketika batas tarif token input akan diisi ulang sepenuhnya, disediakan dalam format RFC 3339. |
anthropic-ratelimit-output-tokens-limit | Jumlah maksimum token output yang diizinkan dalam periode batas tarif apa pun. |
anthropic-ratelimit-output-tokens-remaining | Jumlah token output yang tersisa (dibulatkan ke ribuan terdekat) sebelum dibatasi tarif. |
anthropic-ratelimit-output-tokens-reset | Waktu ketika batas tarif token output akan diisi ulang sepenuhnya, disediakan dalam format RFC 3339. |
anthropic-priority-input-tokens-limit | Jumlah maksimum token input Priority Tier yang diizinkan dalam periode batas tarif apa pun. (Hanya Priority Tier) |
anthropic-priority-input-tokens-remaining | Jumlah token input Priority Tier yang tersisa (dibulatkan ke ribuan terdekat) sebelum dibatasi tarif. (Hanya Priority Tier) |
anthropic-priority-input-tokens-reset | Waktu ketika batas tarif token input Priority Tier akan diisi ulang sepenuhnya, disediakan dalam format RFC 3339. (Hanya Priority Tier) |
anthropic-priority-output-tokens-limit | Jumlah maksimum token output Priority Tier yang diizinkan dalam periode batas tarif apa pun. (Hanya Priority Tier) |
anthropic-priority-output-tokens-remaining | Jumlah token output Priority Tier yang tersisa (dibulatkan ke ribuan terdekat) sebelum dibatasi tarif. (Hanya Priority Tier) |
anthropic-priority-output-tokens-reset | Waktu ketika batas tarif token output Priority Tier akan diisi ulang sepenuhnya, disediakan dalam format RFC 3339. (Hanya Priority Tier) |
anthropic-ratelimit-tokens-*
menampilkan nilai untuk batas paling ketat yang saat ini berlaku. Misalnya, jika Anda telah melebihi batas token per menit Workspace, header akan berisi nilai batas tarif token per menit Workspace. Jika batas Workspace tidak berlaku, header akan mengembalikan total token yang tersisa, di mana total adalah jumlah token input dan output. Pendekatan ini memastikan bahwa Anda memiliki visibilitas ke dalam kendala yang paling relevan pada penggunaan API Anda saat ini.