Nous avons deux types de limites :

  1. Les limites d’utilisation fixent un coût mensuel maximum qu’une organisation peut engager pour l’utilisation de l’API.
  2. Les limites de débit restreignent le nombre de requêtes API qu’une organisation peut effectuer sur une période définie.

À propos de nos limites

  • Les limites sont conçues pour empêcher les abus de l’API, tout en minimisant l’impact sur les modèles d’utilisation courants des clients.
  • Les limites sont définies par niveau d’utilisation, chaque niveau étant associé à un ensemble différent de limites d’utilisation et de débit.
  • Votre organisation augmentera automatiquement de niveau à mesure que vous atteindrez certains seuils lors de l’utilisation de l’API.
    Les limites sont définies au niveau de l’organisation. Vous pouvez voir les limites de votre organisation dans Plans et facturation dans la Console.
  • Vous pouvez atteindre les limites de débit sur des intervalles de temps plus courts. Par exemple, un taux de 60 requêtes par minute (RPM) peut être appliqué à raison de 1 requête par seconde. Des rafales courtes de requêtes à un volume élevé peuvent dépasser la limite de débit et entraîner des erreurs de limite de débit.
  • Les limites décrites ci-dessous sont nos limites standard et s’appliquent au plan d’API “Build”. Si vous recherchez des limites plus élevées et personnalisées, contactez les ventes en cliquant sur “Sélectionner un plan” dans la console pour passer à notre plan personnalisé “Scale”.
  • Tous les modèles Claude ont actuellement les mêmes limites d’utilisation et de débit.

Limites d’utilisation

Chaque niveau d’utilisation a une limite sur la quantité d’utilisation de l’API que vous pouvez faire chaque mois calendaire. Une fois que vous atteignez la limite d’utilisation de votre niveau, jusqu’à ce que vous soyez éligible au niveau suivant, vous devrez attendre le mois suivant pour pouvoir utiliser à nouveau l’API.

Pour être éligible au niveau suivant, vous devez satisfaire à une exigence de dépôt et à une période d’attente obligatoire. Les niveaux supérieurs nécessitent des périodes d’attente plus longues. Notez que pour minimiser le risque de surfinancement de votre compte, vous ne pouvez pas déposer plus que votre limite d’utilisation mensuelle.

Niveau d’utilisationExigences pour passer au niveauUtilisation maximale par mois
Achat de créditAttente après le premier achat
GratuitN/A0 jour10 $
Build Tier 15 $0 jour100 $
Build Tier 240 $7 jours500 $
Build Tier 3200 $7 jours1 000 $
Build Tier 4400 $14 jours5 000 $
ScaleN/AN/AN/A

Limites de débit

Nos limites de débit sont actuellement mesurées en requêtes par minute, jetons par minute et jetons par jour pour chaque classe de modèle. Si vous dépassez l’une des limites de débit, vous obtiendrez une erreur 429. Cliquez sur le niveau de limite de débit pour afficher les limites de débit pertinentes.

Niveau de modèleRequêtes par minute (RPM)Jetons par minute (TPM)Jetons par jour (TPD)
Claude 3 Haiku525 000300 000
Claude 3 Sonnet520 000300 000
Claude 3 Opus510 000300 000

En-têtes de réponse

La réponse de l’API inclut des en-têtes qui vous montrent la limite de débit appliquée, l’utilisation actuelle et le moment où la limite sera réinitialisée.

Les en-têtes suivants sont renvoyés :

En-têteDescription
anthropic-ratelimit-requests-limitLe nombre maximal de requêtes autorisées dans la fenêtre de limite de débit.
anthropic-ratelimit-requests-remainingLe nombre de requêtes restantes dans la fenêtre de limite de débit actuelle.
anthropic-ratelimit-requests-resetL’heure à laquelle la fenêtre de limite de débit des requêtes sera réinitialisée, fournie au format RFC 3339.
anthropic-ratelimit-tokens-limitLe nombre maximal de jetons autorisés dans la fenêtre de limite de débit.
anthropic-ratelimit-tokens-remainingLe nombre de jetons restants, arrondi au millier le plus proche, dans la fenêtre de limite de débit actuelle.
anthropic-ratelimit-tokens-resetL’heure à laquelle la fenêtre de limite de débit des jetons sera réinitialisée, fournie au format RFC 3339.

Les en-têtes de limite de débit des jetons affichent les valeurs de la limite (quotidienne ou par minute) avec le moins de jetons restants. Par exemple, si vous avez dépassé la limite quotidienne de jetons mais que vous n’avez envoyé aucun jeton au cours de la dernière minute, les en-têtes contiendront les valeurs de limite de débit quotidienne des jetons.