Tenemos dos tipos de límites:

  1. Los límites de uso establecen un costo mensual máximo que una organización puede incurrir por el uso de la API.
  2. Los límites de tasa restringen el número de solicitudes a la API que una organización puede realizar durante un período de tiempo definido.

Acerca de nuestros límites

  • Los límites están diseñados para prevenir el abuso de la API, minimizando el impacto en los patrones de uso comunes de los clientes.
  • Los límites se definen por nivel de uso, donde cada nivel está asociado con un conjunto diferente de límites de uso y de tasa.
  • Su organización aumentará de nivel automáticamente a medida que alcance ciertos umbrales mientras usa la API.
    Los límites se establecen a nivel de organización. Puede ver los límites de su organización en Planes y Facturación en la Consola.
  • Puede alcanzar los límites de tasa en intervalos de tiempo más cortos. Por ejemplo, una tasa de 60 solicitudes por minuto (RPM) puede aplicarse como 1 solicitud por segundo. Las ráfagas cortas de solicitudes a un volumen alto pueden superar el límite de tasa y resultar en errores de límite de tasa.
  • Los límites descritos a continuación son nuestros límites estándar y se aplican al plan de API “Build”. Si busca límites más altos y personalizados, contacte a ventas haciendo clic en “Seleccionar Plan” en la consola para cambiar a nuestro plan personalizado “Scale”.
  • Todos los modelos de Claude actualmente tienen los mismos límites de uso y de tasa.

Límites de uso

Cada nivel de uso tiene un límite sobre cuánto puede usar la API cada mes calendario. Una vez que alcance el límite de uso de su nivel, hasta que califique para el siguiente nivel, tendrá que esperar hasta el próximo mes para poder usar la API nuevamente.

Para calificar para el siguiente nivel, debe cumplir con un requisito de depósito y un período de espera obligatorio. Los niveles más altos requieren períodos de espera más largos. Tenga en cuenta que, para minimizar el riesgo de sobrefinanciar su cuenta, no puede depositar más que su límite de uso mensual.

Nivel de usoRequisitos para avanzar al nivelUso máximo por mes
Compra de créditoEspera después de la primera compra
GratisN/A0 días$10
Build Nivel 1$50 días$100
Build Nivel 2$407 días$500
Build Nivel 3$2007 días$1,000
Build Nivel 4$40014 días$5,000
ScaleN/AN/AN/A

Límites de tasa

Nuestros límites de tasa actualmente se miden en solicitudes por minuto, tokens por minuto y tokens por día para cada clase de modelo. Si excede alguno de los límites de tasa, obtendrá un error 429. Haga clic en el nivel de límite de tasa para ver los límites de tasa relevantes.

Nivel de ModeloSolicitudes por minuto (RPM)Tokens por minuto (TPM)Tokens por día (TPD)
Claude 3 Haiku525,000300,000
Claude 3 Sonnet520,000300,000
Claude 3 Opus510,000300,000

Encabezados de respuesta

La respuesta de la API incluye encabezados que le muestran el límite de tasa aplicado, el uso actual y cuándo se restablecerá el límite.

Se devuelven los siguientes encabezados:

EncabezadoDescripción
anthropic-ratelimit-requests-limitEl número máximo de solicitudes permitidas dentro de la ventana de límite de tasa.
anthropic-ratelimit-requests-remainingEl número de solicitudes restantes dentro de la ventana actual de límite de tasa.
anthropic-ratelimit-requests-resetLa hora en que se restablecerá la ventana de límite de tasa de solicitudes, proporcionada en formato RFC 3339.
anthropic-ratelimit-tokens-limitEl número máximo de tokens permitidos dentro de la ventana de límite de tasa.
anthropic-ratelimit-tokens-remainingEl número de tokens restantes, redondeado al millar más cercano, dentro de la ventana actual de límite de tasa.
anthropic-ratelimit-tokens-resetLa hora en que se restablecerá la ventana de límite de tasa de tokens, proporcionada en formato RFC 3339.

Los encabezados de límite de tasa de tokens muestran los valores para el límite (diario o por minuto) con menos tokens restantes. Por ejemplo, si ha excedido el límite diario de tokens pero no ha enviado ningún token en el último minuto, los encabezados contendrán los valores de límite de tasa de tokens diarios.