Kami memiliki dua jenis batasan:

  1. Batas pengeluaran menetapkan biaya bulanan maksimum yang dapat dikeluarkan organisasi untuk penggunaan API.
  2. Batas tingkat membatasi jumlah permintaan API yang dapat dilakukan organisasi dalam periode waktu tertentu.

Kami menerapkan batasan yang dikonfigurasi layanan di tingkat organisasi, tetapi Anda juga dapat menetapkan batasan yang dapat dikonfigurasi pengguna untuk ruang kerja organisasi Anda.

Tentang batasan kami

  • Batasan dirancang untuk mencegah penyalahgunaan API, sambil meminimalkan dampak pada pola penggunaan pelanggan yang umum.
  • Batasan ditentukan berdasarkan tingkat penggunaan, di mana setiap tingkat dikaitkan dengan serangkaian batas pengeluaran dan tingkat yang berbeda.
  • Organisasi Anda akan secara otomatis meningkat tingkatnya saat Anda mencapai ambang batas tertentu saat menggunakan API.
    Batasan ditetapkan di tingkat organisasi. Anda dapat melihat batasan organisasi Anda di Rencana dan Penagihan di Konsol Anthropic.
  • Anda mungkin mencapai batas tingkat dalam interval waktu yang lebih pendek. Misalnya, tingkat 60 permintaan per menit (RPM) dapat diterapkan sebagai 1 permintaan per detik. Lonjakan permintaan singkat dengan volume tinggi dapat melampaui batas tingkat dan mengakibatkan kesalahan batas tingkat.
  • Batasan yang diuraikan di bawah ini adalah batasan standar kami dan berlaku untuk rencana API “Build”. Jika Anda mencari batasan kustom yang lebih tinggi, hubungi bagian penjualan dengan mengklik “Pilih Rencana” di Konsol Anthropic untuk beralih ke rencana “Scale” kustom kami.
  • Kami menggunakan algoritma token bucket untuk melakukan pembatasan tingkat.

Batas pengeluaran

Setiap tingkat penggunaan memiliki batas berapa banyak yang dapat Anda belanjakan untuk API setiap bulan kalender. Setelah Anda mencapai batas pengeluaran tingkat Anda, sampai Anda memenuhi syarat untuk tingkat berikutnya, Anda harus menunggu sampai bulan berikutnya untuk dapat menggunakan API lagi.

Untuk memenuhi syarat tingkat berikutnya, Anda harus memenuhi persyaratan deposit dan periode tunggu wajib. Tingkat yang lebih tinggi memerlukan periode tunggu yang lebih lama. Perhatikan, untuk meminimalkan risiko kelebihan dana pada akun Anda, Anda tidak dapat menyetor lebih dari batas pengeluaran bulanan Anda.

Persyaratan untuk naik tingkat

Tingkat PenggunaanPembelian KreditTunggu Setelah Pembelian PertamaPenggunaan Maks per Bulan
Build Tingkat 1$50 hari$100
Build Tingkat 2$407 hari$500
Build Tingkat 3$2007 hari$1,000
Build Tingkat 4$40014 hari$5,000
ScaleN/AN/AN/A

Batas tingkat

Batas tingkat kami saat ini diukur dalam permintaan per menit, token per menit, dan token per hari untuk setiap kelas model. Jika Anda melebihi salah satu batas tingkat, Anda akan mendapatkan kesalahan 429. Klik pada tingkat batas tingkat untuk melihat batas tingkat yang relevan.

Tingkat ModelPermintaan per menit (RPM)Token per menit (TPM)Token per hari (TPD)
Claude 3.5 Sonnet5040,0001,000,000
Claude 3 Opus5020,0001,000,000
Claude 3 Sonnet5040,0001,000,000
Claude 3 Haiku5050,0005,000,000

Menetapkan batasan lebih rendah untuk Ruang Kerja

Untuk melindungi Ruang Kerja dalam Organisasi Anda dari potensi penggunaan berlebihan, Anda dapat menetapkan batas pengeluaran dan tingkat kustom per Ruang Kerja.

Contoh: Jika batas Organisasi Anda adalah 80.000 token per menit, Anda mungkin membatasi satu Ruang Kerja menjadi 30.000 token per menit. Ini melindungi Ruang Kerja lain dari potensi penggunaan berlebihan dan memastikan distribusi sumber daya yang lebih adil di seluruh Organisasi Anda. Sisa 50.000 token per menit (atau lebih, jika Ruang Kerja itu tidak menggunakan batasnya) kemudian tersedia untuk digunakan oleh Ruang Kerja lain.

Catatan:

  • Anda tidak dapat menetapkan batasan pada Ruang Kerja default.
  • Jika tidak diatur, batasan Ruang Kerja sama dengan batasan Organisasi.
  • Batasan seluruh Organisasi selalu berlaku, bahkan jika batasan Ruang Kerja berjumlah lebih banyak.

Header respons

Respons API mencakup header yang menunjukkan batas tingkat yang diterapkan, penggunaan saat ini, dan kapan batas akan diatur ulang.

Header berikut dikembalikan:

HeaderDeskripsi
anthropic-ratelimit-requests-limitJumlah maksimum permintaan yang diizinkan dalam periode batas tingkat apa pun.
anthropic-ratelimit-requests-remainingJumlah permintaan yang tersisa sebelum dibatasi tingkatnya.
anthropic-ratelimit-requests-resetWaktu ketika batas tingkat permintaan akan diatur ulang, disediakan dalam format RFC 3339.
anthropic-ratelimit-tokens-limitJumlah maksimum token yang diizinkan dalam periode batas tingkat apa pun.
anthropic-ratelimit-tokens-remainingJumlah token yang tersisa (dibulatkan ke ribuan terdekat) sebelum dibatasi tingkatnya.
anthropic-ratelimit-tokens-resetWaktu ketika batas tingkat token akan diatur ulang, disediakan dalam format RFC 3339.
retry-afterJumlah detik sampai Anda dapat mencoba permintaan lagi.

Header batas tingkat token menampilkan nilai untuk batas (harian atau per menit) dengan token yang tersisa lebih sedikit. Misalnya, jika Anda telah melebihi batas token harian tetapi belum mengirim token apa pun dalam satu menit terakhir, header akan berisi nilai batas tingkat token harian.