Подсчет токенов позволяет определить количество токенов в сообщении перед его отправкой Claude, помогая принимать обоснованные решения о ваших запросах и использовании. С помощью подсчета токенов вы можете:
Проактивно управлять ограничениями скорости и затратами
Принимать разумные решения по маршрутизации моделей
Конечная точка подсчета токенов принимает тот же структурированный список входных данных для создания сообщения, включая поддержку системных запросов, инструментов, изображений и PDF. Ответ содержит общее количество входных токенов.
Количество токенов следует рассматривать как оценку. В некоторых случаях фактическое количество входных токенов, используемых при создании сообщения, может незначительно отличаться.
Подсчет токенов серверных инструментов применяется только к первому вызову сэмплирования.
import anthropicclient = anthropic.Anthropic()response = client.messages.count_tokens( model="claude-opus-4-20250514", tools=[{"name":"get_weather","description":"Get the current weather in a given location","input_schema":{"type":"object","properties":{"location":{"type":"string","description":"The city and state, e.g. San Francisco, CA",}},"required":["location"],},}], messages=[{"role":"user","content":"What's the weather like in San Francisco?"}])print(response.json())
Подсчет токенов в сообщениях с расширенным мышлением
Смотрите здесь для получения дополнительной информации о том, как рассчитывается контекстное окно с расширенным мышлением
Блоки мышления из предыдущих ходов ассистента игнорируются и не учитываются в ваших входных токенах
Мышление текущего хода ассистента учитывается в ваших входных токенах
curl https://api.anthropic.com/v1/messages/count_tokens \--header"x-api-key: $ANTHROPIC_API_KEY"\--header"content-type: application/json"\--header"anthropic-version: 2023-06-01"\--data '{"model":"claude-opus-4-20250514","thinking":{"type":"enabled","budget_tokens":16000},"messages":[{"role":"user","content":"Are there an infinite number of prime numbers such that n mod 4 == 3?"},{"role":"assistant","content":[{"type":"thinking","thinking":"This is a nice number theory question. Lets think about it step by step...","signature":"EuYBCkQYAiJAgCs1le6/Pol5Z4/JMomVOouGrWdhYNsH3ukzUECbB6iWrSQtsQuRHJID6lWV..."},{"type":"text","text":"Yes, there are infinitely many prime numbers p such that p mod 4 = 3..."}]},{"role":"user","content":"Can you write a formal proof?"}]}'
Подсчет токенов бесплатен для использования, но подлежит ограничениям запросов в минуту в зависимости от вашего уровня использования. Если вам нужны более высокие лимиты, свяжитесь с отделом продаж через Консоль Anthropic.
Уровень использования
Запросов в минуту (RPM)
1
100
2
2,000
3
4,000
4
8,000
Подсчет токенов и создание сообщений имеют отдельные и независимые ограничения скорости — использование одного не учитывается в ограничениях другого.
Нет, подсчет токенов предоставляет оценку без использования логики кэширования. Хотя вы можете предоставить блоки cache_control в вашем запросе на подсчет токенов, кэширование запросов происходит только во время фактического создания сообщения.