Penghitungan token memungkinkan Anda menentukan jumlah token dalam pesan sebelum mengirimkannya ke Claude, membantu Anda membuat keputusan yang tepat tentang prompt dan penggunaan. Dengan penghitungan token, Anda dapat
Endpoint penghitungan token menerima daftar terstruktur input yang sama untuk membuat pesan, termasuk dukungan untuk prompt sistem, alat, gambar, dan PDF. Respons berisi jumlah total token input.
Jumlah token harus dianggap sebagai perkiraan. Dalam beberapa kasus, jumlah token input yang sebenarnya digunakan saat membuat pesan mungkin berbeda dalam jumlah kecil.
Penghitungan token alat server hanya berlaku untuk panggilan sampling pertama.
import anthropicclient = anthropic.Anthropic()response = client.messages.count_tokens( model="claude-opus-4-20250514", tools=[{"name":"get_weather","description":"Get the current weather in a given location","input_schema":{"type":"object","properties":{"location":{"type":"string","description":"The city and state, e.g. San Francisco, CA",}},"required":["location"],},}], messages=[{"role":"user","content":"What's the weather like in San Francisco?"}])print(response.json())
Menghitung token dalam pesan dengan pemikiran diperpanjang
Lihat di sini untuk detail lebih lanjut tentang bagaimana jendela konteks dihitung dengan pemikiran diperpanjang
Blok pemikiran dari giliran asisten sebelumnya diabaikan dan tidak dihitung sebagai token input Anda
Pemikiran giliran asisten saat inimemang dihitung sebagai token input Anda
curl https://api.anthropic.com/v1/messages/count_tokens \--header"x-api-key: $ANTHROPIC_API_KEY"\--header"content-type: application/json"\--header"anthropic-version: 2023-06-01"\--data '{"model":"claude-opus-4-20250514","thinking":{"type":"enabled","budget_tokens":16000},"messages":[{"role":"user","content":"Are there an infinite number of prime numbers such that n mod 4 == 3?"},{"role":"assistant","content":[{"type":"thinking","thinking":"This is a nice number theory question. Lets think about it step by step...","signature":"EuYBCkQYAiJAgCs1le6/Pol5Z4/JMomVOouGrWdhYNsH3ukzUECbB6iWrSQtsQuRHJID6lWV..."},{"type":"text","text":"Yes, there are infinitely many prime numbers p such that p mod 4 = 3..."}]},{"role":"user","content":"Can you write a formal proof?"}]}'
Penghitungan token gratis untuk digunakan tetapi tunduk pada batas permintaan per menit berdasarkan tingkat penggunaan Anda. Jika Anda membutuhkan batas yang lebih tinggi, hubungi bagian penjualan melalui Anthropic Console.
Tingkat penggunaan
Permintaan per menit (RPM)
1
100
2
2.000
3
4.000
4
8.000
Penghitungan token dan pembuatan pesan memiliki batas tarif yang terpisah dan independen — penggunaan satu tidak dihitung terhadap batas yang lain.
Tidak, penghitungan token memberikan perkiraan tanpa menggunakan logika caching. Meskipun Anda dapat menyediakan blok cache_control dalam permintaan penghitungan token Anda, caching prompt hanya terjadi selama pembuatan pesan yang sebenarnya.