Penghitungan token sedang dalam tahap beta

Untuk mengakses fitur ini, sertakan header anthropic-beta: token-counting-2024-11-01 dalam permintaan API Anda, atau gunakan client.beta.messages.count_tokens dalam panggilan SDK Anda.

Kami akan terus mengembangkan beta terbuka ini dalam beberapa minggu ke depan, jadi kami menghargai umpan balik Anda. Silakan bagikan ide dan saran Anda menggunakan formulir ini.

Penghitungan token memungkinkan Anda menentukan jumlah token dalam pesan sebelum mengirimkannya ke Claude, membantu Anda membuat keputusan yang tepat tentang prompt dan penggunaan. Dengan penghitungan token, Anda dapat:

  • Mengelola batas penggunaan dan biaya secara proaktif
  • Membuat keputusan perutean model yang cerdas
  • Mengoptimalkan prompt untuk panjang tertentu

Cara menghitung token pesan

Endpoint penghitungan token menerima daftar terstruktur input yang sama untuk membuat pesan, termasuk dukungan untuk prompt sistem, alat, gambar, dan PDF. Respons berisi jumlah total token input.

Jumlah token harus dianggap sebagai perkiraan. Dalam beberapa kasus, jumlah token input yang sebenarnya digunakan saat membuat pesan mungkin berbeda dalam jumlah kecil.

Model yang didukung

Endpoint penghitungan token mendukung model berikut:

  • Claude 3.5 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Haiku
  • Claude 3 Opus

Menghitung token dalam pesan dasar

JSON
{ "input_tokens": 14 }

Menghitung token dalam pesan dengan alat

JSON
{ "input_tokens": 403 }

Menghitung token dalam pesan dengan gambar

JSON
{ "input_tokens": 1551 }

Menghitung token dalam pesan dengan PDF

JSON
{ "input_tokens": 2188 }

API Penghitungan Token mendukung PDF dengan batasan yang sama seperti API Pesan.


Harga dan batas penggunaan

Penghitungan token gratis untuk digunakan tetapi tunduk pada batas permintaan per menit berdasarkan tingkat penggunaan Anda. Jika Anda membutuhkan batas yang lebih tinggi, hubungi bagian penjualan melalui Anthropic Console.

Tingkat penggunaanPermintaan per menit (RPM)
1100
22,000
34,000
48,000

Penghitungan token dan pembuatan pesan memiliki batas penggunaan yang terpisah dan independen — penggunaan satu tidak dihitung terhadap batas yang lain.