Подсчет токенов позволяет определить количество токенов в сообщении перед его отправкой в Claude, помогая принимать обоснованные решения о ваших запросах и использовании. С помощью подсчета токенов вы можете:
Эндпоинт подсчета токенов принимает тот же структурированный список входных данных для создания сообщения, включая поддержку системных промптов, инструментов, изображений и PDF. Ответ содержит общее количество входных токенов.
Количество токенов следует рассматривать как оценку. В некоторых случаях фактическое количество входных токенов, используемых при создании сообщения, может незначительно отличаться.
import anthropicclient = anthropic.Anthropic()response = client.messages.count_tokens( model="claude-3-7-sonnet-20250219", tools=[{"name":"get_weather","description":"Get the current weather in a given location","input_schema":{"type":"object","properties":{"location":{"type":"string","description":"The city and state, e.g. San Francisco, CA",}},"required":["location"],},}], messages=[{"role":"user","content":"What's the weather like in San Francisco?"}])print(response.json())
Подсчет токенов в сообщениях с расширенным мышлением
Подробнее о том, как рассчитывается контекстное окно с расширенным мышлением, смотрите здесь
Блоки мышления из предыдущих ответов ассистента игнорируются и не учитываются в количестве входных токенов
Мышление в текущем ответе ассистента учитывается в количестве входных токенов
Copy
curl https://api.anthropic.com/v1/messages/count_tokens \--header"x-api-key: $ANTHROPIC_API_KEY"\--header"content-type: application/json"\--header"anthropic-version: 2023-06-01"\--data '{"model":"claude-3-7-sonnet-20250219","thinking":{"type":"enabled","budget_tokens":16000},"messages":[{"role":"user","content":"Are there an infinite number of prime numbers such that n mod 4 == 3?"},{"role":"assistant","content":[{"type":"thinking","thinking":"This is a nice number theory question. Lets think about it step by step...","signature":"EuYBCkQYAiJAgCs1le6/Pol5Z4/JMomVOouGrWdhYNsH3ukzUECbB6iWrSQtsQuRHJID6lWV..."},{"type":"text","text":"Yes, there are infinitely many prime numbers p such that p mod 4 = 3..."}]},{"role":"user","content":"Can you write a formal proof?"}]}'
Подсчет токенов бесплатен, но подчиняется ограничениям на количество запросов в минуту в зависимости от вашего уровня использования. Если вам нужны более высокие лимиты, свяжитесь с отделом продаж через Консоль Anthropic.
Уровень использования
Запросов в минуту (RPM)
1
100
2
2,000
3
4,000
4
8,000
Подсчет токенов и создание сообщений имеют отдельные и независимые ограничения - использование одного не учитывается в ограничениях другого.
Нет, подсчет токенов предоставляет оценку без использования логики кэширования. Хотя вы можете включать блоки cache_control в ваш запрос на подсчет токенов, кэширование промптов происходит только при фактическом создании сообщения.