Nous avons deux types de limites :

  1. Les limites d’utilisation fixent un coût mensuel maximum qu’une organisation peut engager pour l’utilisation de l’API.
  2. Les limites de débit restreignent le nombre de requêtes API qu’une organisation peut effectuer sur une période définie.

À propos de nos limites

  • Les limites sont conçues pour empêcher les abus de l’API, tout en minimisant l’impact sur les modèles d’utilisation courants des clients.
  • Les limites sont définies par niveau d’utilisation, chaque niveau étant associé à un ensemble différent de limites d’utilisation et de débit.
  • Votre organisation augmentera automatiquement de niveau à mesure que vous atteindrez certains seuils lors de l’utilisation de l’API.
    Les limites sont définies au niveau de l’organisation. Vous pouvez voir les limites de votre organisation dans Plans et facturation dans la Console Anthropic.
  • Vous pouvez atteindre les limites de débit sur des intervalles de temps plus courts. Par exemple, un taux de 60 requêtes par minute (RPM) peut être appliqué à raison de 1 requête par seconde. Des rafales courtes de requêtes à un volume élevé peuvent dépasser la limite de débit et entraîner des erreurs de limite de débit.
  • Les limites décrites ci-dessous sont nos limites standard et s’appliquent au plan d’API “Build”. Si vous recherchez des limites plus élevées et personnalisées, contactez les ventes en cliquant sur “Sélectionner un plan” dans la Console Anthropic pour passer à notre plan personnalisé “Scale”.
  • Nous utilisons l’algorithme du seau à jetons pour effectuer la limitation de débit.

Limites d’utilisation

Chaque niveau d’utilisation a une limite sur la quantité d’utilisation de l’API chaque mois calendaire. Une fois que vous atteignez la limite d’utilisation de votre niveau, jusqu’à ce que vous soyez éligible au niveau suivant, vous devrez attendre le mois suivant pour pouvoir utiliser à nouveau l’API.

Pour être éligible au niveau suivant, vous devez satisfaire à une exigence de dépôt et à une période d’attente obligatoire. Les niveaux supérieurs nécessitent des périodes d’attente plus longues. Notez que pour minimiser le risque de surfinancement de votre compte, vous ne pouvez pas déposer plus que votre limite d’utilisation mensuelle.

Exigences pour avancer de niveau

Niveau d’utilisationAchat de créditAttente après le premier achatUtilisation max par mois
GratuitN/A0 jours$10
Build Tier 1$50 jours$100
Build Tier 2$407 jours$500
Build Tier 3$2007 jours$1,000
Build Tier 4$40014 jours$5,000
ScaleN/AN/AN/A

Limites de débit

Nos limites de débit sont actuellement mesurées en requêtes par minute, jetons par minute et jetons par jour pour chaque classe de modèle. Si vous dépassez l’une des limites de débit, vous obtiendrez une erreur 429. Cliquez sur le niveau de limite de débit pour afficher les limites de débit pertinentes.

Niveau de modèleRequêtes par minute (RPM)Jetons par minute (TPM)Jetons par jour (TPD)
Claude 3.5 Sonnet520,000300,000
Claude 3 Opus510,000300,000
Claude 3 Sonnet520,000300,000
Claude 3 Haiku525,000300,000

En-têtes de réponse

La réponse de l’API inclut des en-têtes qui vous montrent la limite de débit appliquée, l’utilisation actuelle et le moment où la limite sera réinitialisée.

Les en-têtes suivants sont renvoyés :

En-têteDescription
anthropic-ratelimit-requests-limitLe nombre maximum de requêtes autorisées dans n’importe quelle période de limite de débit.
anthropic-ratelimit-requests-remainingLe nombre de requêtes restantes avant d’être limité en débit.
anthropic-ratelimit-requests-resetL’heure à laquelle la limite de débit des requêtes sera réinitialisée, fournie au format RFC 3339.
anthropic-ratelimit-tokens-limitLe nombre maximum de jetons autorisés dans n’importe quelle période de limite de débit.
anthropic-ratelimit-tokens-remainingLe nombre de jetons restants (arrondi au millier le plus proche) avant d’être limité en débit.
anthropic-ratelimit-tokens-resetL’heure à laquelle la limite de débit des jetons sera réinitialisée, fournie au format RFC 3339.
retry-afterLe nombre de secondes jusqu’à ce que vous puissiez réessayer la requête.

Les en-têtes de limite de débit des jetons affichent les valeurs de la limite (quotidienne ou par minute) avec le moins de jetons restants. Par exemple, si vous avez dépassé la limite quotidienne de jetons mais que vous n’avez envoyé aucun jeton au cours de la dernière minute, les en-têtes contiendront les valeurs de limite de débit quotidienne des jetons.