Limiti di utilizzo
Per mitigare l’uso improprio e gestire la capacità della nostra API, abbiamo implementato limiti su quanto un’organizzazione può utilizzare l’API di Claude.
Abbiamo due tipi di limiti:
- I limiti di spesa stabiliscono un costo mensile massimo che un’organizzazione può sostenere per l’utilizzo dell’API.
- I limiti di frequenza stabiliscono il numero massimo di richieste API che un’organizzazione può effettuare in un determinato periodo di tempo.
Applichiamo limiti configurati dal servizio a livello di organizzazione, ma è possibile anche impostare limiti configurabili dall’utente per gli spazi di lavoro della propria organizzazione.
Informazioni sui nostri limiti
- I limiti sono progettati per prevenire l’abuso dell’API, minimizzando l’impatto sui modelli di utilizzo comuni dei clienti.
- I limiti sono definiti per livello di utilizzo, dove ogni livello è associato a un diverso set di limiti di spesa e di frequenza.
- La tua organizzazione aumenterà automaticamente di livello quando raggiungerai determinate soglie durante l’utilizzo dell’API.
- I limiti sono impostati a livello di organizzazione. Puoi vedere i limiti della tua organizzazione nella pagina Limiti nella Console Anthropic.
- Potresti raggiungere i limiti di frequenza su intervalli di tempo più brevi. Ad esempio, una frequenza di 60 richieste al minuto (RPM) potrebbe essere applicata come 1 richiesta al secondo. Brevi raffiche di richieste ad alto volume possono superare il limite di frequenza e causare errori di limite.
- I limiti descritti di seguito sono i nostri limiti standard. Se stai cercando limiti personalizzati più elevati, contatta l’ufficio vendite tramite la Console Anthropic.
- Utilizziamo l’algoritmo token bucket per limitare la frequenza.
- Tutti i limiti qui descritti rappresentano l’utilizzo massimo consentito, non minimi garantiti. Questi limiti sono progettati per prevenire l’uso eccessivo e garantire una equa distribuzione delle risorse tra gli utenti.
Limiti di spesa
Ogni livello di utilizzo ha un limite su quanto puoi spendere sull’API ogni mese solare. Una volta raggiunto il limite di spesa del tuo livello, fino a quando non ti qualifichi per il livello successivo, dovrai attendere il mese successivo per poter utilizzare nuovamente l’API.
Per qualificarti per il livello successivo, devi soddisfare un requisito di deposito e un periodo di attesa obbligatorio. I livelli più alti richiedono periodi di attesa più lunghi. Nota: per minimizzare il rischio di sovraccreditare il tuo account, non puoi depositare più del tuo limite di spesa mensile.
Requisiti per avanzare di livello
Livello di Utilizzo | Acquisto Crediti | Attesa Dopo il Primo Acquisto | Utilizzo Massimo Mensile |
---|---|---|---|
Livello 1 | $5 | 0 giorni | $100 |
Livello 2 | $40 | 7 giorni | $500 |
Livello 3 | $200 | 7 giorni | $1.000 |
Livello 4 | $400 | 14 giorni | $5.000 |
Fatturazione Mensile | N/D | N/D | N/D |
Limiti di frequenza aggiornati
I nostri limiti di frequenza sono misurati in richieste al minuto, token di input al minuto e token di output al minuto per ogni classe di modello. Se superi uno qualsiasi dei limiti di frequenza riceverai un errore 429. Clicca sul livello di limite di frequenza per visualizzare i limiti pertinenti.
I limiti di frequenza sono monitorati per modello. Pertanto, i modelli all’interno dello stesso livello non condividono un limite di frequenza.
Modello | Richieste massime al minuto (RPM) | Token di input massimi al minuto (ITPM) | Token di output massimi al minuto (OTPM) |
---|---|---|---|
Claude 3.5 Sonnet 2024-10-22 | 50 | 40.000 | 8.000 |
Claude 3.5 Sonnet 2024-06-20 | 50 | 40.000 | 8.000 |
Claude 3.5 Haiku | 50 | 50.000 | 10.000 |
Claude 3 Opus | 50 | 20.000 | 4.000 |
Claude 3 Sonnet | 50 | 40.000 | 8.000 |
Claude 3 Haiku | 50 | 50.000 | 10.000 |
Impostazione di limiti inferiori per gli Spazi di Lavoro
Per proteggere gli Spazi di Lavoro nella tua Organizzazione da potenziali utilizzi eccessivi, puoi impostare limiti di spesa e di frequenza personalizzati per ogni Spazio di Lavoro.
Esempio: Se il limite della tua Organizzazione è di 48.000 token al minuto (40.000 token di input e 8.000 token di output), potresti limitare uno Spazio di Lavoro a 30.000 token totali al minuto. Questo protegge altri Spazi di Lavoro da potenziali utilizzi eccessivi e garantisce una distribuzione più equa delle risorse all’interno della tua Organizzazione. I token al minuto rimanenti non utilizzati (o di più, se quello Spazio di Lavoro non utilizza il limite) sono quindi disponibili per l’uso da parte di altri Spazi di Lavoro.
Nota:
- Non puoi impostare limiti sullo Spazio di Lavoro predefinito.
- Se non impostati, i limiti degli Spazi di Lavoro corrispondono al limite dell’Organizzazione.
- I limiti a livello di Organizzazione si applicano sempre, anche se i limiti degli Spazi di Lavoro sommati superano tale valore.
- Il supporto per i limiti di token di input e output sarà aggiunto agli Spazi di Lavoro in futuro.
Header di risposta
La risposta dell’API include header che mostrano il limite di frequenza applicato, l’utilizzo corrente e quando il limite verrà azzerato.
Vengono restituiti i seguenti header:
Header | Descrizione |
---|---|
anthropic-ratelimit-requests-limit | Il numero massimo di richieste consentite all’interno di qualsiasi periodo di limite di frequenza. |
anthropic-ratelimit-requests-remaining | Il numero di richieste rimanenti prima di essere limitato. |
anthropic-ratelimit-requests-reset | L’ora in cui il limite di frequenza delle richieste verrà azzerato, fornito in formato RFC 3339. |
anthropic-ratelimit-tokens-limit | Il numero massimo di token consentiti all’interno di qualsiasi periodo di limite di frequenza. |
anthropic-ratelimit-tokens-remaining | Il numero di token rimanenti (arrotondato al migliaio più vicino) prima di essere limitato. |
anthropic-ratelimit-tokens-reset | L’ora in cui il limite di frequenza dei token verrà azzerato, fornito in formato RFC 3339. |
anthropic-ratelimit-input-tokens-limit | Il numero massimo di token di input consentiti all’interno di qualsiasi periodo di limite di frequenza. |
anthropic-ratelimit-input-tokens-remaining | Il numero di token di input rimanenti (arrotondato al migliaio più vicino) prima di essere limitato. |
anthropic-ratelimit-input-tokens-reset | L’ora in cui il limite di frequenza dei token di input verrà azzerato, fornito in formato RFC 3339. |
anthropic-ratelimit-output-tokens-limit | Il numero massimo di token di output consentiti all’interno di qualsiasi periodo di limite di frequenza. |
anthropic-ratelimit-output-tokens-remaining | Il numero di token di output rimanenti (arrotondato al migliaio più vicino) prima di essere limitato. |
anthropic-ratelimit-output-tokens-reset | L’ora in cui il limite di frequenza dei token di output verrà azzerato, fornito in formato RFC 3339. |
retry-after | Il numero di secondi prima di poter riprovare la richiesta. |
Gli header anthropic-ratelimit-tokens-*
mostrano i valori per il limite più restrittivo attualmente in vigore. Ad esempio, se hai superato il limite di token al minuto dello Spazio di Lavoro, gli header conterranno i valori del limite di frequenza dei token al minuto dello Spazio di Lavoro. Se i limiti dello Spazio di Lavoro non si applicano, gli header restituiranno il totale dei token rimanenti, dove il totale è la somma dei token di input e output. Questo approccio garantisce che tu abbia visibilità sul vincolo più rilevante per il tuo utilizzo corrente dell’API.
Limiti di frequenza precedenti
I nostri limiti di frequenza erano precedentemente misurati in richieste al minuto, token al minuto e token al giorno per ogni classe di modello. Se superi uno qualsiasi dei limiti di frequenza riceverai un errore 429. Clicca sul livello di limite di frequenza per visualizzare i limiti pertinenti.
I limiti di frequenza sono monitorati per modello, quindi i modelli all’interno dello stesso livello non condividono un limite di frequenza.
Modello | Richieste massime al minuto (RPM) | Token massimi al minuto (TPM) | Token massimi al giorno (TPD) |
---|---|---|---|
Claude 3.5 Sonnet 2024-10-22 | 50 | 40.000 | 1.000.000 |
Claude 3.5 Sonnet 2024-06-20 | 50 | 40.000 | 1.000.000 |
Claude 3.5 Haiku | 50 | 50.000 | 5.000.000 |
Claude 3 Opus | 50 | 20.000 | 1.000.000 |
Claude 3 Sonnet | 50 | 40.000 | 1.000.000 |
Claude 3 Haiku | 50 | 50.000 | 5.000.000 |