Contagem de tokens (beta)
A contagem de tokens está em beta
Para acessar este recurso, inclua o cabeçalho anthropic-beta: token-counting-2024-11-01
em suas solicitações de API, ou use client.beta.messages.count_tokens
em suas chamadas SDK.
Estaremos iterando neste beta aberto nas próximas semanas, então agradecemos seu feedback. Por favor, compartilhe suas ideias e sugestões usando este formulário.
A contagem de tokens permite determinar o número de tokens em uma mensagem antes de enviá-la ao Claude, ajudando você a tomar decisões informadas sobre seus prompts e uso. Com a contagem de tokens, você pode:
- Gerenciar proativamente limites de taxa e custos
- Tomar decisões inteligentes de roteamento de modelo
- Otimizar prompts para um comprimento específico
Como contar tokens de mensagem
O endpoint de contagem de tokens aceita a mesma lista estruturada de entradas para criar uma mensagem, incluindo suporte para prompts do sistema, ferramentas, imagens e PDFs. A resposta contém o número total de tokens de entrada.
A contagem de tokens deve ser considerada uma estimativa. Em alguns casos, o número real de tokens de entrada usados ao criar uma mensagem pode diferir em uma pequena quantidade.
Modelos suportados
O endpoint de contagem de tokens suporta os seguintes modelos:
- Claude 3.5 Sonnet
- Claude 3.5 Haiku
- Claude 3 Haiku
- Claude 3 Opus
Contar tokens em mensagens básicas
{ "input_tokens": 14 }
Contar tokens em mensagens com ferramentas
{ "input_tokens": 403 }
Contar tokens em mensagens com imagens
{ "input_tokens": 1551 }
Contar tokens em mensagens com PDFs
{ "input_tokens": 2188 }
A API de Contagem de Tokens suporta PDFs com as mesmas limitações que a API de Mensagens.
Preços e limites de taxa
A contagem de tokens é gratuita para uso, mas está sujeita a limites de taxa de solicitações por minuto com base em seu nível de uso. Se você precisar de limites mais altos, entre em contato com vendas através do Console Anthropic.
Nível de uso | Solicitações por minuto (RPM) |
---|---|
1 | 100 |
2 | 2.000 |
3 | 4.000 |
4 | 8.000 |
A contagem de tokens e a criação de mensagens têm limites de taxa separados e independentes — o uso de um não conta para os limites do outro.