Esta página fornece informações detalhadas sobre preços para os modelos e recursos da Anthropic. Todos os preços estão em USD.

Para obter as informações mais atualizadas sobre preços, visite anthropic.com/pricing.

Preços dos modelos

A tabela a seguir mostra os preços para todos os modelos Claude em diferentes níveis de uso:

ModelBase Input TokensCache WritesCache HitsOutput Tokens
Claude 3.7 Sonnet$3 / MTok$3.75 / MTok$0.30 / MTok$15 / MTok
Claude 3.5 Sonnet$3 / MTok$3.75 / MTok$0.30 / MTok$15 / MTok
Claude 3.5 Haiku$0.80 / MTok$1 / MTok$0.08 / MTok$4 / MTok
Claude 3 Opus$15 / MTok$18.75 / MTok$1.50 / MTok$75 / MTok
Claude 3 Haiku$0.25 / MTok$0.30 / MTok$0.03 / MTok$1.25 / MTok

MTok = Milhões de tokens. A coluna “Base Input Tokens” mostra o preço padrão de entrada, “Cache Writes” e “Cache Hits” são específicos para cache de prompts, e “Output Tokens” mostra o preço de saída.

Preços específicos por recurso

Processamento em lote

A API de Lote permite o processamento assíncrono de grandes volumes de solicitações com 50% de desconto em tokens de entrada e saída.

ModelBatch inputBatch output
Claude 3.7 Sonnet$1.50 / MTok$7.50 / MTok
Claude 3.5 Sonnet$1.50 / MTok$7.50 / MTok
Claude 3.5 Haiku$0.40 / MTok$2 / MTok
Claude 3 Opus$7.50 / MTok$37.50 / MTok
Claude 3 Haiku$0.125 / MTok$0.625 / MTok

Para mais informações sobre processamento em lote, consulte nossa documentação de processamento em lote.

Preços de uso de ferramentas

Tool use requests are priced based on:

  1. The total number of input tokens sent to the model (including in the tools parameter)
  2. The number of output tokens generated
  3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

The additional tokens from tool use come from:

  • The tools parameter in API requests (tool names, descriptions, and schemas)
  • tool_use content blocks in API requests and responses
  • tool_result content blocks in API requests

When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

ModelTool choiceTool use system prompt token count
Claude 3.7 Sonnetauto, none
any, tool
346 tokens
313 tokens
Claude 3.5 Sonnet (Oct)auto, none
any, tool
346 tokens
313 tokens
Claude 3 Opusauto, none
any, tool
530 tokens
281 tokens
Claude 3 Sonnetauto, none
any, tool
159 tokens
235 tokens
Claude 3 Haikuauto, none
any, tool
264 tokens
340 tokens
Claude 3.5 Sonnet (June)auto, none
any, tool
294 tokens
261 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request.

Para preços atuais por modelo, consulte nossa seção preços dos modelos acima.

Para mais informações sobre implementação e melhores práticas de uso de ferramentas, consulte nossa documentação de uso de ferramentas.

Exemplos de preços para casos de uso de agentes

Entender os preços para aplicações de agentes é crucial ao construir com Claude. Estes exemplos do mundo real podem ajudar você a estimar custos para diferentes padrões de agentes.

Exemplo de agente de suporte ao cliente

Ao construir um agente de suporte ao cliente, veja como os custos podem ser distribuídos:

Exemplo de cálculo para processar 10.000 tickets de suporte:

  • Média de ~3.700 tokens por conversa
  • Usando Claude 3.7 Sonnet a 3/MTokdeentrada,3/MTok de entrada, 15/MTok de saída
  • Custo total: ~$22,20 por 10.000 tickets

Para um passo a passo detalhado deste cálculo, veja nosso guia de agente de suporte ao cliente.

Preços gerais do fluxo de trabalho do agente

Para arquiteturas de agentes mais complexas com múltiplas etapas:

  1. Processamento inicial da solicitação

    • Entrada típica: 500-1.000 tokens
    • Custo de processamento: ~$0,003 por solicitação
  2. Recuperação de memória e contexto

    • Contexto recuperado: 2.000-5.000 tokens
    • Custo por recuperação: ~$0,015 por operação
  3. Planejamento e execução de ações

    • Tokens de planejamento: 1.000-2.000
    • Feedback de execução: 500-1.000
    • Custo combinado: ~$0,045 por ação

Para um guia abrangente sobre padrões de preços de agentes, veja nosso guia de casos de uso de agentes.

Estratégias de otimização de custos

Ao construir agentes com Claude:

  1. Use modelos apropriados: Escolha Haiku para tarefas simples, Sonnet para raciocínio complexo
  2. Implemente cache de prompts: Reduza custos para contexto repetido
  3. Operações em lote: Use a API de Lote para tarefas não sensíveis ao tempo
  4. Monitore padrões de uso: Acompanhe o consumo de tokens para identificar oportunidades de otimização

Para aplicações de agentes com alto volume, considere contatar nossa equipe de vendas empresariais para arranjos personalizados de preços.

Considerações adicionais sobre preços

Limites de taxa

Os limites de taxa variam por nível de uso e afetam quantas solicitações você pode fazer:

  • Nível 1: Uso de nível inicial com limites básicos
  • Nível 2: Limites aumentados para aplicações em crescimento
  • Nível 3: Limites mais altos para aplicações estabelecidas
  • Nível 4: Limites padrão máximos
  • Empresarial: Limites personalizados disponíveis

Para informações detalhadas sobre limites de taxa, veja nossa documentação de limites de taxa.

Descontos por volume

Descontos por volume podem estar disponíveis para usuários de alto volume. Estes são negociados caso a caso.

  • Níveis padrão usam os preços mostrados acima
  • Clientes empresariais podem contatar vendas para preços personalizados
  • Descontos acadêmicos e de pesquisa podem estar disponíveis

Preços empresariais

Para clientes empresariais com necessidades específicas:

  • Limites de taxa personalizados
  • Descontos por volume
  • Suporte dedicado
  • Termos personalizados

Contate nossa equipe de vendas em sales@anthropic.com ou através do Console Anthropic para discutir opções de preços empresariais.

Faturamento e pagamento

  • O faturamento é calculado mensalmente com base no uso real
  • Pagamentos são processados em USD
  • Opções de cartão de crédito e faturamento disponíveis
  • Acompanhamento de uso disponível no Console Anthropic

Perguntas frequentes

Como é calculado o uso de tokens?

Tokens são pedaços de texto que os modelos processam. Como estimativa aproximada, 1 token é aproximadamente 4 caracteres ou 0,75 palavras em inglês. A contagem exata varia por idioma e tipo de conteúdo.

Existem níveis gratuitos ou testes?

Novos usuários recebem uma pequena quantidade de créditos gratuitos para testar a API. Contate vendas para informações sobre testes estendidos para avaliação empresarial.

Como os descontos se acumulam?

Descontos da API de Lote e cache de prompts podem ser combinados. Por exemplo, usar ambos os recursos juntos fornece economias significativas de custos em comparação com chamadas padrão da API.

Quais métodos de pagamento são aceitos?

Aceitamos os principais cartões de crédito para contas padrão. Clientes empresariais podem organizar faturamento e outros métodos de pagamento.

Para perguntas adicionais sobre preços, contate support@anthropic.com.