Claude Code consuma token per ogni interazione. Il costo medio è di 6persviluppatorealgiorno,conicostigiornaliericherimangonosottoi6 per sviluppatore al giorno, con i costi giornalieri che rimangono sotto i 12 per il 90% degli utenti.

Per l’utilizzo del team, Claude Code addebita in base al consumo di token API. In media, Claude Code costa ~$100-200/sviluppatore al mese con Sonnet 4 anche se c’è una grande varianza a seconda di quante istanze gli utenti stanno eseguendo e se lo stanno usando nell’automazione.

Monitora i tuoi costi

  • Usa /cost per vedere l’utilizzo della sessione corrente
  • Utenti della Console Anthropic:
  • Utenti dei piani Pro e Max: L’utilizzo è incluso nel tuo abbonamento

Gestione dei costi per i team

Quando usi l’API Anthropic, puoi limitare la spesa totale del workspace Claude Code. Per configurare, segui queste istruzioni. Gli amministratori possono visualizzare i report sui costi e l’utilizzo seguendo queste istruzioni.

Su Bedrock e Vertex, Claude Code non invia metriche dal tuo cloud. Per ottenere metriche sui costi, diverse grandi aziende hanno riferito di utilizzare LiteLLM, che è uno strumento open-source che aiuta le aziende a monitorare la spesa per chiave. Questo progetto non è affiliato con Anthropic e non abbiamo verificato la sua sicurezza.

Raccomandazioni sui limiti di velocità

Quando configuri Claude Code per i team, considera queste raccomandazioni di Token Per Minuto (TPM) e Richieste Per Minuto (RPM) per utente basate sulla dimensione della tua organizzazione:

Dimensione del teamTPM per utenteRPM per utente
1-5 utenti200k-300k5-7
5-20 utenti100k-150k2.5-3.5
20-50 utenti50k-75k1.25-1.75
50-100 utenti25k-35k0.62-0.87
100-500 utenti15k-20k0.37-0.47
500+ utenti10k-15k0.25-0.35

Ad esempio, se hai 200 utenti, potresti richiedere 20k TPM per ogni utente, o 4 milioni di TPM totali (200*20.000 = 4 milioni).

Il TPM per utente diminuisce man mano che la dimensione del team cresce perché ci aspettiamo che meno utenti utilizzino Claude Code contemporaneamente nelle organizzazioni più grandi. Questi limiti di velocità si applicano a livello di organizzazione, non per singolo utente, il che significa che i singoli utenti possono temporaneamente consumare più della loro quota calcolata quando altri non stanno utilizzando attivamente il servizio.

Se prevedi scenari con un utilizzo simultaneo insolitamente alto (come sessioni di formazione dal vivo con grandi gruppi), potresti aver bisogno di allocazioni TPM più elevate per utente.

Ridurre l’utilizzo dei token

  • Conversazioni compatte:

    • Claude usa la compattazione automatica per impostazione predefinita quando il contesto supera il 95% della capacità

    • Attiva/disattiva la compattazione automatica: Esegui /config e naviga su “Auto-compact enabled”

    • Usa /compact manualmente quando il contesto diventa grande

    • Aggiungi istruzioni personalizzate: /compact Focus on code samples and API usage

    • Personalizza la compattazione aggiungendo a CLAUDE.md:

      # Istruzioni di riepilogo
      
      Quando stai usando compact, concentrati sull'output dei test e sui cambiamenti del codice
      
  • Scrivi query specifiche: Evita richieste vaghe che attivano scansioni non necessarie

  • Suddividi compiti complessi: Dividi compiti grandi in interazioni mirate

  • Cancella la cronologia tra i compiti: Usa /clear per reimpostare il contesto

I costi possono variare significativamente in base a:

  • Dimensione del codebase analizzato
  • Complessità delle query
  • Numero di file cercati o modificati
  • Lunghezza della cronologia delle conversazioni
  • Frequenza di compattazione delle conversazioni
  • Processi in background (generazione haiku, riassunto delle conversazioni)

Utilizzo dei token in background

Claude Code usa token per alcune funzionalità in background anche quando è inattivo:

  • Generazione haiku: Piccoli messaggi creativi che appaiono mentre digiti (circa 1 centesimo al giorno)
  • Riassunto delle conversazioni: Lavori in background che riassumono le conversazioni precedenti per la funzione claude --resume
  • Elaborazione dei comandi: Alcuni comandi come /cost possono generare richieste per controllare lo stato

Questi processi in background consumano una piccola quantità di token (tipicamente sotto $0.04 per sessione) anche senza interazione attiva.

Per le distribuzioni del team, raccomandiamo di iniziare con un piccolo gruppo pilota per stabilire i modelli di utilizzo prima di un rollout più ampio.