Gestire i costi in modo efficace
Scopri come monitorare e ottimizzare l’utilizzo dei token e i costi quando usi Claude Code.
Claude Code consuma token per ogni interazione. Il costo medio è di 12 per il 90% degli utenti.
Per l’utilizzo del team, Claude Code addebita in base al consumo di token API. In media, Claude Code costa ~$50-60/sviluppatore al mese con Sonnet 4, anche se c’è una grande varianza a seconda di quante istanze gli utenti stanno eseguendo e se lo stanno usando nell’automazione.
Monitora i tuoi costi
- Usa
/cost
per vedere l’utilizzo della sessione corrente - Utenti della Console Anthropic:
- Controlla l’utilizzo storico nella Console Anthropic (richiede il ruolo Admin o Billing)
- Imposta limiti di spesa del workspace per il workspace Claude Code (richiede il ruolo Admin)
- Utenti dei piani Pro e Max: L’utilizzo è incluso nel tuo abbonamento
Gestione dei costi per i team
Quando usi l’API Anthropic, puoi limitare la spesa totale del workspace Claude Code. Per configurare, segui queste istruzioni. Gli amministratori possono visualizzare i report sui costi e l’utilizzo seguendo queste istruzioni.
Su Bedrock e Vertex, Claude Code non invia metriche dal tuo cloud. Per ottenere metriche sui costi, diverse grandi aziende hanno riferito di utilizzare LiteLLM, che è uno strumento open-source che aiuta le aziende a monitorare la spesa per chiave. Questo progetto non è affiliato con Anthropic e non abbiamo verificato la sua sicurezza.
Ridurre l’utilizzo dei token
-
Conversazioni compatte:
-
Claude usa la compattazione automatica per impostazione predefinita quando il contesto supera il 95% della capacità
-
Attiva/disattiva la compattazione automatica: Esegui
/config
e naviga su “Auto-compact enabled” -
Usa
/compact
manualmente quando il contesto diventa grande -
Aggiungi istruzioni personalizzate:
/compact Focus on code samples and API usage
-
Personalizza la compattazione aggiungendo a CLAUDE.md:
-
-
Scrivi query specifiche: Evita richieste vaghe che attivano scansioni non necessarie
-
Suddividi compiti complessi: Dividi compiti grandi in interazioni mirate
-
Cancella la cronologia tra i compiti: Usa
/clear
per resettare il contesto
I costi possono variare significativamente in base a:
- Dimensione del codebase analizzato
- Complessità delle query
- Numero di file cercati o modificati
- Lunghezza della cronologia delle conversazioni
- Frequenza di compattazione delle conversazioni
- Processi in background (generazione haiku, riassunto delle conversazioni)
Utilizzo dei token in background
Claude Code usa token per alcune funzionalità in background anche quando è inattivo:
- Generazione haiku: Piccoli messaggi creativi che appaiono mentre digiti (circa 1 centesimo al giorno)
- Riassunto delle conversazioni: Lavori in background che riassumono le conversazioni precedenti per la funzione
claude --resume
- Elaborazione dei comandi: Alcuni comandi come
/cost
possono generare richieste per controllare lo stato
Questi processi in background consumano una piccola quantità di token (tipicamente sotto $0.04 per sessione) anche senza interazione attiva.
Per le distribuzioni del team, raccomandiamo di iniziare con un piccolo gruppo pilota per stabilire i modelli di utilizzo prima di un rollout più ampio.