Gerir custos de forma eficaz
Aprenda como rastrear e otimizar o uso de tokens e custos ao usar Claude Code.
Claude Code consome tokens para cada interação. O custo médio é 12 para 90% dos usuários.
Para uso em equipe, Claude Code cobra pelo consumo de tokens da API. Em média, Claude Code custa ~$50-60/desenvolvedor por mês com Sonnet 4, embora haja grande variação dependendo de quantas instâncias os usuários estão executando e se estão usando em automação.
Rastreie seus custos
- Use
/cost
para ver o uso da sessão atual - Usuários do Console Anthropic:
- Verifique uso histórico no Console Anthropic (requer função Admin ou Billing)
- Defina limites de gastos do workspace para o workspace Claude Code (requer função Admin)
- Usuários dos planos Pro e Max: O uso está incluído na sua assinatura
Gerenciando custos para equipes
Ao usar a API Anthropic, você pode limitar o gasto total do workspace Claude Code. Para configurar, siga estas instruções. Administradores podem visualizar relatórios de custo e uso seguindo estas instruções.
No Bedrock e Vertex, Claude Code não envia métricas da sua nuvem. Para obter métricas de custo, várias grandes empresas relataram usar LiteLLM, que é uma ferramenta de código aberto que ajuda empresas a rastrear gastos por chave. Este projeto não é afiliado à Anthropic e não auditamos sua segurança.
Reduzir uso de tokens
-
Conversas compactas:
-
Claude usa auto-compactação por padrão quando o contexto excede 95% da capacidade
-
Alternar auto-compactação: Execute
/config
e navegue para “Auto-compact enabled” -
Use
/compact
manualmente quando o contexto ficar grande -
Adicione instruções personalizadas:
/compact Focus on code samples and API usage
-
Personalize a compactação adicionando ao CLAUDE.md:
-
-
Escreva consultas específicas: Evite solicitações vagas que acionam escaneamento desnecessário
-
Divida tarefas complexas: Divida tarefas grandes em interações focadas
-
Limpe o histórico entre tarefas: Use
/clear
para redefinir o contexto
Os custos podem variar significativamente com base em:
- Tamanho da base de código sendo analisada
- Complexidade das consultas
- Número de arquivos sendo pesquisados ou modificados
- Duração do histórico de conversas
- Frequência de compactação de conversas
- Processos em segundo plano (geração de haiku, resumo de conversas)
Uso de tokens em segundo plano
Claude Code usa tokens para algumas funcionalidades em segundo plano mesmo quando inativo:
- Geração de haiku: Pequenas mensagens criativas que aparecem enquanto você digita (aproximadamente 1 centavo por dia)
- Resumo de conversas: Trabalhos em segundo plano que resumem conversas anteriores para o recurso
claude --resume
- Processamento de comandos: Alguns comandos como
/cost
podem gerar solicitações para verificar status
Esses processos em segundo plano consomem uma pequena quantidade de tokens (tipicamente abaixo de $0.04 por sessão) mesmo sem interação ativa.
Para implantações em equipe, recomendamos começar com um pequeno grupo piloto para estabelecer padrões de uso antes de uma implementação mais ampla.