Abbiamo due tipi di limiti:

  1. I limiti di utilizzo stabiliscono un costo mensile massimo che un’organizzazione può sostenere per l’utilizzo dell’API.
  2. I limiti di frequenza limitano il numero di richieste API che un’organizzazione può effettuare in un periodo di tempo definito.

Informazioni sui nostri limiti

  • I limiti sono progettati per prevenire l’abuso dell’API, minimizzando al contempo l’impatto sui comuni modelli di utilizzo dei clienti.
  • I limiti sono definiti per livello di utilizzo, dove ogni livello è associato a un diverso set di limiti di utilizzo e di frequenza.
  • La tua organizzazione aumenterà automaticamente di livello quando raggiungerai determinate soglie durante l’utilizzo dell’API.
    I limiti sono impostati a livello di organizzazione. Puoi vedere i limiti della tua organizzazione in Piani e Fatturazione nella Console.
  • Potresti raggiungere i limiti di frequenza su intervalli di tempo più brevi. Ad esempio, una frequenza di 60 richieste al minuto (RPM) può essere applicata come 1 richiesta al secondo. Brevi raffiche di richieste ad alto volume possono superare il limite di frequenza e risultare in errori di limite di frequenza.
  • I limiti descritti di seguito sono i nostri limiti standard e si applicano al piano API “Build”. Se stai cercando limiti più alti e personalizzati, contatta il reparto vendite cliccando su “Seleziona Piano” nella console per passare al nostro piano personalizzato “Scale”.
  • Tutti i modelli di Claude attualmente hanno gli stessi limiti di utilizzo e di frequenza.

Limiti di utilizzo

Ogni livello di utilizzo ha un limite su quanto puoi utilizzare l’API ogni mese di calendario. Una volta raggiunto il limite di utilizzo del tuo livello, fino a quando non ti qualifichi per il livello successivo, dovrai aspettare fino al mese successivo per poter utilizzare nuovamente l’API.

Per qualificarti per il livello successivo, devi soddisfare un requisito di deposito e un periodo di attesa obbligatorio. I livelli più alti richiedono periodi di attesa più lunghi. Nota che, per ridurre al minimo il rischio di sovrafinanziare il tuo account, non puoi depositare più del tuo limite di utilizzo mensile.

Livello di utilizzoRequisiti per avanzare al livelloUtilizzo massimo mensile
Acquisto creditoAttesa dopo il primo acquisto
GratuitoN/A0 giorni$10
Build Livello 1$50 giorni$100
Build Livello 2$407 giorni$500
Build Livello 3$2007 giorni$1,000
Build Livello 4$40014 giorni$5,000
ScaleN/AN/AN/A

Limiti di frequenza

I nostri limiti di frequenza sono attualmente misurati in richieste al minuto, token al minuto e token al giorno per ogni classe di modello. Se superi uno qualsiasi dei limiti di frequenza, riceverai un errore 429. Fai clic sul livello di limite di frequenza per visualizzare i limiti di frequenza pertinenti.

Livello ModelloRichieste al minuto (RPM)Token al minuto (TPM)Token al giorno (TPD)
Claude 3 Haiku525,000300,000
Claude 3 Sonnet520,000300,000
Claude 3 Opus510,000300,000

Intestazioni di risposta

La risposta dell’API include intestazioni che mostrano il limite di frequenza applicato, l’utilizzo corrente e quando il limite verrà reimpostato.

Vengono restituite le seguenti intestazioni:

IntestazioneDescrizione
anthropic-ratelimit-requests-limitIl numero massimo di richieste consentite all’interno della finestra del limite di frequenza.
anthropic-ratelimit-requests-remainingIl numero di richieste rimanenti all’interno della finestra corrente del limite di frequenza.
anthropic-ratelimit-requests-resetL’ora in cui la finestra del limite di frequenza delle richieste verrà reimpostata, fornita nel formato RFC 3339.
anthropic-ratelimit-tokens-limitIl numero massimo di token consentiti all’interno della finestra del limite di frequenza.
anthropic-ratelimit-tokens-remainingIl numero di token rimanenti, arrotondato al migliaio più vicino, all’interno della finestra corrente del limite di frequenza.
anthropic-ratelimit-tokens-resetL’ora in cui la finestra del limite di frequenza dei token verrà reimpostata, fornita nel formato RFC 3339.

Le intestazioni del limite di frequenza dei token visualizzano i valori per il limite (giornaliero o al minuto) con meno token rimanenti. Ad esempio, se hai superato il limite di token giornaliero ma non hai inviato alcun token nell’ultimo minuto, le intestazioni conterranno i valori del limite di frequenza dei token giornalieri.