A contagem de tokens está em beta

Para acessar este recurso, inclua o cabeçalho anthropic-beta: token-counting-2024-11-01 em suas solicitações de API, ou use client.beta.messages.count_tokens em suas chamadas SDK.

Estaremos iterando neste beta aberto nas próximas semanas, então agradecemos seu feedback. Por favor, compartilhe suas ideias e sugestões usando este formulário.

A contagem de tokens permite determinar o número de tokens em uma mensagem antes de enviá-la ao Claude, ajudando você a tomar decisões informadas sobre seus prompts e uso. Com a contagem de tokens, você pode:

  • Gerenciar proativamente limites de taxa e custos
  • Tomar decisões inteligentes de roteamento de modelo
  • Otimizar prompts para um comprimento específico

Como contar tokens de mensagem

O endpoint de contagem de tokens aceita a mesma lista estruturada de entradas para criar uma mensagem, incluindo suporte para prompts do sistema, ferramentas, imagens e PDFs. A resposta contém o número total de tokens de entrada.

A contagem de tokens deve ser considerada uma estimativa. Em alguns casos, o número real de tokens de entrada usados ao criar uma mensagem pode diferir em uma pequena quantidade.

Modelos suportados

O endpoint de contagem de tokens suporta os seguintes modelos:

  • Claude 3.5 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Haiku
  • Claude 3 Opus

Contar tokens em mensagens básicas

JSON
{ "input_tokens": 14 }

Contar tokens em mensagens com ferramentas

JSON
{ "input_tokens": 403 }

Contar tokens em mensagens com imagens

JSON
{ "input_tokens": 1551 }

Contar tokens em mensagens com PDFs

JSON
{ "input_tokens": 2188 }

A API de Contagem de Tokens suporta PDFs com as mesmas limitações que a API de Mensagens.


Preços e limites de taxa

A contagem de tokens é gratuita para uso, mas está sujeita a limites de taxa de solicitações por minuto com base em seu nível de uso. Se você precisar de limites mais altos, entre em contato com vendas através do Console Anthropic.

Nível de usoSolicitações por minuto (RPM)
1100
22.000
34.000
48.000

A contagem de tokens e a criação de mensagens têm limites de taxa separados e independentes — o uso de um não conta para os limites do outro.