Questa pagina fornisce informazioni dettagliate sui prezzi per i modelli e le funzionalità di Anthropic. Tutti i prezzi sono in USD.

Per le informazioni più aggiornate sui prezzi, visita anthropic.com/pricing.

Prezzi dei modelli

La seguente tabella mostra i prezzi per tutti i modelli Claude attraverso diversi livelli di utilizzo:

ModelBase Input TokensCache WritesCache HitsOutput Tokens
Claude 3.7 Sonnet$3 / MTok$3.75 / MTok$0.30 / MTok$15 / MTok
Claude 3.5 Sonnet$3 / MTok$3.75 / MTok$0.30 / MTok$15 / MTok
Claude 3.5 Haiku$0.80 / MTok$1 / MTok$0.08 / MTok$4 / MTok
Claude 3 Opus$15 / MTok$18.75 / MTok$1.50 / MTok$75 / MTok
Claude 3 Haiku$0.25 / MTok$0.30 / MTok$0.03 / MTok$1.25 / MTok

MTok = Milioni di token. La colonna “Base Input Tokens” mostra i prezzi standard di input, “Cache Writes” e “Cache Hits” sono specifici per il caching dei prompt, e “Output Tokens” mostra i prezzi di output.

Prezzi specifici per funzionalità

Elaborazione batch

L’API Batch permette l’elaborazione asincrona di grandi volumi di richieste con uno sconto del 50% sia sui token di input che di output.

ModelBatch inputBatch output
Claude 3.7 Sonnet$1.50 / MTok$7.50 / MTok
Claude 3.5 Sonnet$1.50 / MTok$7.50 / MTok
Claude 3.5 Haiku$0.40 / MTok$2 / MTok
Claude 3 Opus$7.50 / MTok$37.50 / MTok
Claude 3 Haiku$0.125 / MTok$0.625 / MTok

Per maggiori informazioni sull’elaborazione batch, consulta la nostra documentazione sull’elaborazione batch.

Prezzi per l’uso degli strumenti

Tool use requests are priced based on:

  1. The total number of input tokens sent to the model (including in the tools parameter)
  2. The number of output tokens generated
  3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

The additional tokens from tool use come from:

  • The tools parameter in API requests (tool names, descriptions, and schemas)
  • tool_use content blocks in API requests and responses
  • tool_result content blocks in API requests

When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

ModelTool choiceTool use system prompt token count
Claude 3.7 Sonnetauto, none
any, tool
346 tokens
313 tokens
Claude 3.5 Sonnet (Oct)auto, none
any, tool
346 tokens
313 tokens
Claude 3 Opusauto, none
any, tool
530 tokens
281 tokens
Claude 3 Sonnetauto, none
any, tool
159 tokens
235 tokens
Claude 3 Haikuauto, none
any, tool
264 tokens
340 tokens
Claude 3.5 Sonnet (June)auto, none
any, tool
294 tokens
261 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request.

Per i prezzi attuali per modello, fai riferimento alla nostra sezione prezzi dei modelli qui sopra.

Per maggiori informazioni sull’implementazione degli strumenti e le migliori pratiche, consulta la nostra documentazione sull’uso degli strumenti.

Esempi di prezzi per casi d’uso degli agenti

Comprendere i prezzi per le applicazioni degli agenti è cruciale quando si sviluppa con Claude. Questi esempi reali possono aiutarti a stimare i costi per diversi modelli di agenti.

Esempio di agente per il supporto clienti

Quando si costruisce un agente per il supporto clienti, ecco come potrebbero suddividersi i costi:

Esempio di calcolo per l’elaborazione di 10.000 ticket di supporto:

  • Media di ~3.700 token per conversazione
  • Utilizzo di Claude 3.7 Sonnet a 3/MTokinput,3/MTok input, 15/MTok output
  • Costo totale: ~$22.20 per 10.000 ticket

Per una spiegazione dettagliata di questo calcolo, consulta la nostra guida all’agente per il supporto clienti.

Prezzi del flusso di lavoro generale dell’agente

Per architetture di agenti più complesse con più passaggi:

  1. Elaborazione della richiesta iniziale

    • Input tipico: 500-1.000 token
    • Costo di elaborazione: ~$0.003 per richiesta
  2. Recupero della memoria e del contesto

    • Contesto recuperato: 2.000-5.000 token
    • Costo per recupero: ~$0.015 per operazione
  3. Pianificazione e esecuzione delle azioni

    • Token di pianificazione: 1.000-2.000
    • Feedback di esecuzione: 500-1.000
    • Costo combinato: ~$0.045 per azione

Per una guida completa sui modelli di prezzo degli agenti, consulta la nostra guida ai casi d’uso degli agenti.

Strategie di ottimizzazione dei costi

Quando si costruiscono agenti con Claude:

  1. Usa i modelli appropriati: Scegli Haiku per compiti semplici, Sonnet per ragionamenti complessi
  2. Implementa il caching dei prompt: Riduci i costi per il contesto ripetuto
  3. Operazioni batch: Usa l’API Batch per attività non sensibili al tempo
  4. Monitora i modelli di utilizzo: Traccia il consumo di token per identificare opportunità di ottimizzazione

Per applicazioni di agenti ad alto volume, considera di contattare il nostro team vendite enterprise per accordi di prezzo personalizzati.

Considerazioni aggiuntive sui prezzi

Limiti di velocità

I limiti di velocità variano per livello di utilizzo e influenzano quante richieste puoi effettuare:

  • Livello 1: Utilizzo base con limiti standard
  • Livello 2: Limiti aumentati per applicazioni in crescita
  • Livello 3: Limiti più alti per applicazioni consolidate
  • Livello 4: Limiti standard massimi
  • Enterprise: Limiti personalizzati disponibili

Per informazioni dettagliate sui limiti di velocità, consulta la nostra documentazione sui limiti di velocità.

Sconti sul volume

Gli sconti sul volume possono essere disponibili per utenti ad alto volume. Questi vengono negoziati caso per caso.

  • I livelli standard utilizzano i prezzi mostrati sopra
  • I clienti enterprise possono contattare le vendite per prezzi personalizzati
  • Potrebbero essere disponibili sconti accademici e per la ricerca

Prezzi enterprise

Per i clienti enterprise con esigenze specifiche:

  • Limiti di velocità personalizzati
  • Sconti sul volume
  • Supporto dedicato
  • Termini personalizzati

Contatta il nostro team vendite all’indirizzo sales@anthropic.com o attraverso la Console Anthropic per discutere le opzioni di prezzo enterprise.

Fatturazione e pagamento

  • La fatturazione viene calcolata mensilmente in base all’utilizzo effettivo
  • I pagamenti vengono elaborati in USD
  • Disponibili opzioni di carta di credito e fatturazione
  • Monitoraggio dell’utilizzo disponibile nella Console Anthropic

Domande frequenti

Come viene calcolato l’utilizzo dei token?

I token sono parti di testo che i modelli elaborano. Come stima approssimativa, 1 token è circa 4 caratteri o 0,75 parole in inglese. Il conteggio esatto varia per lingua e tipo di contenuto.

Ci sono livelli gratuiti o prove?

I nuovi utenti ricevono una piccola quantità di crediti gratuiti per testare l’API. Contatta le vendite per informazioni su prove estese per la valutazione enterprise.

Come si combinano gli sconti?

Gli sconti dell’API Batch e del caching dei prompt possono essere combinati. Per esempio, utilizzare entrambe le funzionalità insieme fornisce significativi risparmi sui costi rispetto alle chiamate API standard.

Quali metodi di pagamento sono accettati?

Accettiamo le principali carte di credito per gli account standard. I clienti enterprise possono organizzare la fatturazione e altri metodi di pagamento.

Per ulteriori domande sui prezzi, contatta support@anthropic.com.