Límites de tasa
Para mitigar el uso indebido y gestionar la capacidad de nuestra API, hemos implementado límites sobre cuánto puede usar una organización la API de Claude.
Tenemos dos tipos de límites:
- Los límites de uso establecen un costo mensual máximo que una organización puede incurrir por el uso de la API.
- Los límites de tasa restringen el número de solicitudes a la API que una organización puede realizar durante un período de tiempo definido.
Acerca de nuestros límites
- Los límites están diseñados para prevenir el abuso de la API, al tiempo que minimizan el impacto en los patrones de uso comunes de los clientes.
- Los límites se definen por nivel de uso, donde cada nivel está asociado con un conjunto diferente de límites de uso y de tasa.
- Su organización aumentará de nivel automáticamente a medida que alcance ciertos umbrales mientras usa la API.
Los límites se establecen a nivel de organización. Puede ver los límites de su organización en Planes y Facturación en la Consola de Anthropic. - Es posible que alcance los límites de tasa en intervalos de tiempo más cortos. Por ejemplo, una tasa de 60 solicitudes por minuto (RPM) puede aplicarse como 1 solicitud por segundo. Las ráfagas cortas de solicitudes a un volumen alto pueden superar el límite de tasa y resultar en errores de límite de tasa.
- Los límites descritos a continuación son nuestros límites estándar y se aplican al plan de API “Build”. Si busca límites más altos y personalizados, comuníquese con ventas haciendo clic en “Seleccionar plan” en la Consola de Anthropic para cambiar a nuestro plan personalizado “Scale”.
- Usamos el algoritmo de token bucket para hacer la limitación de tasa.
Límites de uso
Cada nivel de uso tiene un límite sobre cuánto puede usar la API cada mes calendario. Una vez que alcance el límite de uso de su nivel, hasta que califique para el siguiente nivel, tendrá que esperar hasta el próximo mes para poder usar la API nuevamente.
Para calificar para el siguiente nivel, debe cumplir con un requisito de depósito y un período de espera obligatorio. Los niveles más altos requieren períodos de espera más largos. Tenga en cuenta que, para minimizar el riesgo de sobrefinanciar su cuenta, no puede depositar más que su límite de uso mensual.
Requisitos para avanzar de nivel
Nivel de uso | Compra de crédito | Espera después de la primera compra | Uso máximo por mes |
---|---|---|---|
Gratis | N/A | 0 días | $10 |
Build Nivel 1 | $5 | 0 días | $100 |
Build Nivel 2 | $40 | 7 días | $500 |
Build Nivel 3 | $200 | 7 días | $1,000 |
Build Nivel 4 | $400 | 14 días | $5,000 |
Scale | N/A | N/A | N/A |
Límites de tasa
Nuestros límites de tasa actualmente se miden en solicitudes por minuto, tokens por minuto y tokens por día para cada clase de modelo. Si excede alguno de los límites de tasa, obtendrá un error 429. Haga clic en el nivel de límite de tasa para ver los límites de tasa relevantes.
Nivel de modelo | Solicitudes por minuto (RPM) | Tokens por minuto (TPM) | Tokens por día (TPD) |
---|---|---|---|
Claude 3.5 Sonnet | 5 | 20,000 | 300,000 |
Claude 3 Opus | 5 | 10,000 | 300,000 |
Claude 3 Sonnet | 5 | 20,000 | 300,000 |
Claude 3 Haiku | 5 | 25,000 | 300,000 |
Encabezados de respuesta
La respuesta de la API incluye encabezados que le muestran el límite de tasa aplicado, el uso actual y cuándo se restablecerá el límite.
Se devuelven los siguientes encabezados:
Encabezado | Descripción |
---|---|
anthropic-ratelimit-requests-limit | El número máximo de solicitudes permitidas dentro de cualquier período de límite de tasa. |
anthropic-ratelimit-requests-remaining | El número de solicitudes restantes antes de alcanzar el límite de tasa. |
anthropic-ratelimit-requests-reset | La hora en que se restablecerá el límite de tasa de solicitudes, proporcionada en formato RFC 3339. |
anthropic-ratelimit-tokens-limit | El número máximo de tokens permitidos dentro de cualquier período de límite de tasa. |
anthropic-ratelimit-tokens-remaining | El número de tokens restantes (redondeado al millar más cercano) antes de alcanzar el límite de tasa. |
anthropic-ratelimit-tokens-reset | La hora en que se restablecerá el límite de tasa de tokens, proporcionada en formato RFC 3339. |
retry-after | El número de segundos hasta que pueda reintentar la solicitud. |
Los encabezados de límite de tasa de tokens muestran los valores para el límite (diario o por minuto) con menos tokens restantes. Por ejemplo, si ha excedido el límite de tokens diario pero no ha enviado ningún token en el último minuto, los encabezados contendrán los valores de límite de tasa de tokens diarios.