Preços
Saiba mais sobre a estrutura de preços da Anthropic para modelos e recursos
Esta página fornece informações detalhadas sobre preços para os modelos e recursos da Anthropic. Todos os preços estão em USD.
Para obter as informações mais atualizadas sobre preços, visite anthropic.com/pricing.
Preços dos modelos
A tabela a seguir mostra os preços para todos os modelos Claude em diferentes níveis de uso:
Model | Base Input Tokens | Cache Writes | Cache Hits | Output Tokens |
---|---|---|---|---|
Claude 3.7 Sonnet | $3 / MTok | $3.75 / MTok | $0.30 / MTok | $15 / MTok |
Claude 3.5 Sonnet | $3 / MTok | $3.75 / MTok | $0.30 / MTok | $15 / MTok |
Claude 3.5 Haiku | $0.80 / MTok | $1 / MTok | $0.08 / MTok | $4 / MTok |
Claude 3 Opus | $15 / MTok | $18.75 / MTok | $1.50 / MTok | $75 / MTok |
Claude 3 Haiku | $0.25 / MTok | $0.30 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Milhões de tokens. A coluna “Base Input Tokens” mostra o preço padrão de entrada, “Cache Writes” e “Cache Hits” são específicos para cache de prompts, e “Output Tokens” mostra o preço de saída.
Preços específicos por recurso
Processamento em lote
A API de Lote permite o processamento assíncrono de grandes volumes de solicitações com 50% de desconto em tokens de entrada e saída.
Model | Batch input | Batch output |
---|---|---|
Claude 3.7 Sonnet | $1.50 / MTok | $7.50 / MTok |
Claude 3.5 Sonnet | $1.50 / MTok | $7.50 / MTok |
Claude 3.5 Haiku | $0.40 / MTok | $2 / MTok |
Claude 3 Opus | $7.50 / MTok | $37.50 / MTok |
Claude 3 Haiku | $0.125 / MTok | $0.625 / MTok |
Para mais informações sobre processamento em lote, consulte nossa documentação de processamento em lote.
Preços de uso de ferramentas
Tool use requests are priced based on:
- The total number of input tokens sent to the model (including in the
tools
parameter) - The number of output tokens generated
- For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
- The
tools
parameter in API requests (tool names, descriptions, and schemas) tool_use
content blocks in API requests and responsestool_result
content blocks in API requests
When you use tools
, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools
are provided, then a tool choice of none
uses 0 additional system prompt tokens.
Model | Tool choice | Tool use system prompt token count |
---|---|---|
Claude 3.7 Sonnet | auto , none any , tool | 346 tokens 313 tokens |
Claude 3.5 Sonnet (Oct) | auto , none any , tool | 346 tokens 313 tokens |
Claude 3 Opus | auto , none any , tool | 530 tokens 281 tokens |
Claude 3 Sonnet | auto , none any , tool | 159 tokens 235 tokens |
Claude 3 Haiku | auto , none any , tool | 264 tokens 340 tokens |
Claude 3.5 Sonnet (June) | auto , none any , tool | 294 tokens 261 tokens |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
Para preços atuais por modelo, consulte nossa seção preços dos modelos acima.
Para mais informações sobre implementação e melhores práticas de uso de ferramentas, consulte nossa documentação de uso de ferramentas.
Exemplos de preços para casos de uso de agentes
Entender os preços para aplicações de agentes é crucial ao construir com Claude. Estes exemplos do mundo real podem ajudar você a estimar custos para diferentes padrões de agentes.
Exemplo de agente de suporte ao cliente
Ao construir um agente de suporte ao cliente, veja como os custos podem ser distribuídos:
Exemplo de cálculo para processar 10.000 tickets de suporte:
- Média de ~3.700 tokens por conversa
- Usando Claude 3.7 Sonnet a 15/MTok de saída
- Custo total: ~$22,20 por 10.000 tickets
Para um passo a passo detalhado deste cálculo, veja nosso guia de agente de suporte ao cliente.
Preços gerais do fluxo de trabalho do agente
Para arquiteturas de agentes mais complexas com múltiplas etapas:
-
Processamento inicial da solicitação
- Entrada típica: 500-1.000 tokens
- Custo de processamento: ~$0,003 por solicitação
-
Recuperação de memória e contexto
- Contexto recuperado: 2.000-5.000 tokens
- Custo por recuperação: ~$0,015 por operação
-
Planejamento e execução de ações
- Tokens de planejamento: 1.000-2.000
- Feedback de execução: 500-1.000
- Custo combinado: ~$0,045 por ação
Para um guia abrangente sobre padrões de preços de agentes, veja nosso guia de casos de uso de agentes.
Estratégias de otimização de custos
Ao construir agentes com Claude:
- Use modelos apropriados: Escolha Haiku para tarefas simples, Sonnet para raciocínio complexo
- Implemente cache de prompts: Reduza custos para contexto repetido
- Operações em lote: Use a API de Lote para tarefas não sensíveis ao tempo
- Monitore padrões de uso: Acompanhe o consumo de tokens para identificar oportunidades de otimização
Para aplicações de agentes com alto volume, considere contatar nossa equipe de vendas empresariais para arranjos personalizados de preços.
Considerações adicionais sobre preços
Limites de taxa
Os limites de taxa variam por nível de uso e afetam quantas solicitações você pode fazer:
- Nível 1: Uso de nível inicial com limites básicos
- Nível 2: Limites aumentados para aplicações em crescimento
- Nível 3: Limites mais altos para aplicações estabelecidas
- Nível 4: Limites padrão máximos
- Empresarial: Limites personalizados disponíveis
Para informações detalhadas sobre limites de taxa, veja nossa documentação de limites de taxa.
Descontos por volume
Descontos por volume podem estar disponíveis para usuários de alto volume. Estes são negociados caso a caso.
- Níveis padrão usam os preços mostrados acima
- Clientes empresariais podem contatar vendas para preços personalizados
- Descontos acadêmicos e de pesquisa podem estar disponíveis
Preços empresariais
Para clientes empresariais com necessidades específicas:
- Limites de taxa personalizados
- Descontos por volume
- Suporte dedicado
- Termos personalizados
Contate nossa equipe de vendas em sales@anthropic.com ou através do Console Anthropic para discutir opções de preços empresariais.
Faturamento e pagamento
- O faturamento é calculado mensalmente com base no uso real
- Pagamentos são processados em USD
- Opções de cartão de crédito e faturamento disponíveis
- Acompanhamento de uso disponível no Console Anthropic
Perguntas frequentes
Como é calculado o uso de tokens?
Tokens são pedaços de texto que os modelos processam. Como estimativa aproximada, 1 token é aproximadamente 4 caracteres ou 0,75 palavras em inglês. A contagem exata varia por idioma e tipo de conteúdo.
Existem níveis gratuitos ou testes?
Novos usuários recebem uma pequena quantidade de créditos gratuitos para testar a API. Contate vendas para informações sobre testes estendidos para avaliação empresarial.
Como os descontos se acumulam?
Descontos da API de Lote e cache de prompts podem ser combinados. Por exemplo, usar ambos os recursos juntos fornece economias significativas de custos em comparação com chamadas padrão da API.
Quais métodos de pagamento são aceitos?
Aceitamos os principais cartões de crédito para contas padrão. Clientes empresariais podem organizar faturamento e outros métodos de pagamento.
Para perguntas adicionais sobre preços, contate support@anthropic.com.
Was this page helpful?