Limiti di frequenza
Per mitigare l’uso improprio e gestire la capacità sulla nostra API, abbiamo implementato dei limiti su quanto un’organizzazione può utilizzare l’API di Claude.
Abbiamo due tipi di limiti:
- I limiti di utilizzo stabiliscono un costo mensile massimo che un’organizzazione può sostenere per l’utilizzo dell’API.
- I limiti di frequenza limitano il numero di richieste API che un’organizzazione può effettuare in un periodo di tempo definito.
Informazioni sui nostri limiti
- I limiti sono progettati per prevenire l’abuso dell’API, minimizzando al contempo l’impatto sui modelli di utilizzo comuni dei clienti.
- I limiti sono definiti per livello di utilizzo, dove ogni livello è associato a un diverso set di limiti di utilizzo e di frequenza.
- La tua organizzazione aumenterà automaticamente di livello man mano che raggiungerai determinate soglie durante l’utilizzo dell’API.
I limiti sono impostati a livello di organizzazione. Puoi vedere i limiti della tua organizzazione in Piani e Fatturazione nella Console Anthropic. - Potresti raggiungere i limiti di frequenza su intervalli di tempo più brevi. Ad esempio, una frequenza di 60 richieste al minuto (RPM) può essere applicata come 1 richiesta al secondo. Brevi raffiche di richieste ad alto volume possono superare il limite di frequenza e risultare in errori di limite di frequenza.
- I limiti delineati di seguito sono i nostri limiti standard e si applicano al piano API “Build”. Se stai cercando limiti più alti e personalizzati, contatta il reparto vendite cliccando su “Seleziona Piano” nella Console Anthropic per passare al nostro piano personalizzato “Scale”.
- Utilizziamo l’algoritmo del secchio di token per effettuare la limitazione della frequenza.
Limiti di utilizzo
Ogni livello di utilizzo ha un limite su quanto puoi utilizzare l’API ogni mese di calendario. Una volta raggiunto il limite di utilizzo del tuo livello, fino a quando non ti qualifichi per il livello successivo, dovrai aspettare fino al mese successivo per poter utilizzare nuovamente l’API.
Per qualificarti per il livello successivo, devi soddisfare un requisito di deposito e un periodo di attesa obbligatorio. I livelli più alti richiedono periodi di attesa più lunghi. Nota che, per ridurre al minimo il rischio di sovrafinanziare il tuo account, non puoi depositare più del tuo limite di utilizzo mensile.
Requisiti per avanzare di livello
Livello di Utilizzo | Acquisto di Credito | Attesa Dopo il Primo Acquisto | Utilizzo Massimo al Mese |
---|---|---|---|
Gratuito | N/A | 0 giorni | $10 |
Build Livello 1 | $5 | 0 giorni | $100 |
Build Livello 2 | $40 | 7 giorni | $500 |
Build Livello 3 | $200 | 7 giorni | $1,000 |
Build Livello 4 | $400 | 14 giorni | $5,000 |
Scale | N/A | N/A | N/A |
Limiti di frequenza
I nostri limiti di frequenza sono attualmente misurati in richieste al minuto, token al minuto e token al giorno per ogni classe di modello. Se superi uno qualsiasi dei limiti di frequenza, riceverai un errore 429. Fai clic sul livello di limite di frequenza per visualizzare i limiti di frequenza pertinenti.
Livello Modello | Richieste al minuto (RPM) | Token al minuto (TPM) | Token al giorno (TPD) |
---|---|---|---|
Claude 3.5 Sonnet | 5 | 20,000 | 300,000 |
Claude 3 Opus | 5 | 10,000 | 300,000 |
Claude 3 Sonnet | 5 | 20,000 | 300,000 |
Claude 3 Haiku | 5 | 25,000 | 300,000 |
Intestazioni di risposta
La risposta dell’API include intestazioni che mostrano il limite di frequenza applicato, l’utilizzo corrente e quando il limite verrà reimpostato.
Vengono restituite le seguenti intestazioni:
Intestazione | Descrizione |
---|---|
anthropic-ratelimit-requests-limit | Il numero massimo di richieste consentite all’interno di qualsiasi periodo di limite di frequenza. |
anthropic-ratelimit-requests-remaining | Il numero di richieste rimanenti prima di essere limitato dalla frequenza. |
anthropic-ratelimit-requests-reset | L’ora in cui il limite di frequenza delle richieste verrà reimpostato, fornito nel formato RFC 3339. |
anthropic-ratelimit-tokens-limit | Il numero massimo di token consentiti all’interno di qualsiasi periodo di limite di frequenza. |
anthropic-ratelimit-tokens-remaining | Il numero di token rimanenti (arrotondato al migliaio più vicino) prima di essere limitato dalla frequenza. |
anthropic-ratelimit-tokens-reset | L’ora in cui il limite di frequenza dei token verrà reimpostato, fornito nel formato RFC 3339. |
retry-after | Il numero di secondi fino a quando puoi riprovare la richiesta. |
Le intestazioni del limite di frequenza dei token visualizzano i valori per il limite (giornaliero o al minuto) con meno token rimanenti. Ad esempio, se hai superato il limite di token giornaliero ma non hai inviato alcun token nell’ultimo minuto, le intestazioni conterranno i valori del limite di frequenza dei token giornalieri.