Temos dois tipos de limites:

  1. Limites de uso definem um custo mensal máximo que uma organização pode incorrer para o uso da API.
  2. Limites de taxa restringem o número de solicitações de API que uma organização pode fazer durante um período de tempo definido.

Sobre nossos limites

  • Os limites são projetados para evitar o abuso da API, minimizando o impacto nos padrões de uso comuns do cliente.
  • Os limites são definidos por nível de uso, onde cada nível está associado a um conjunto diferente de limites de uso e taxa.
  • Sua organização aumentará os níveis automaticamente à medida que você atingir certos limites ao usar a API.
    Os limites são definidos no nível da organização. Você pode ver os limites da sua organização em Planos e Faturamento no Console.
  • Você pode atingir limites de taxa em intervalos de tempo mais curtos. Por exemplo, uma taxa de 60 solicitações por minuto (RPM) pode ser aplicada como 1 solicitação por segundo. Rajadas curtas de solicitações em um volume alto podem ultrapassar o limite de taxa e resultar em erros de limite de taxa.
  • Os limites descritos abaixo são nossos limites padrão e se aplicam ao plano de API “Build”. Se você estiver buscando limites mais altos e personalizados, entre em contato com as vendas clicando em “Selecionar Plano” no console para mudar para nosso plano personalizado “Scale”.
  • Todos os modelos do Claude atualmente têm os mesmos limites de uso e taxa.

Limites de uso

Cada nível de uso tem um limite de quanto você pode usar a API a cada mês do calendário. Depois de atingir o limite de uso do seu nível, até se qualificar para o próximo nível, você terá que esperar até o próximo mês para poder usar a API novamente.

Para se qualificar para o próximo nível, você deve atender a um requisito de depósito e um período de espera obrigatório. Níveis mais altos exigem períodos de espera mais longos. Observe que, para minimizar o risco de superfinanciamento da sua conta, você não pode depositar mais do que seu limite de uso mensal.

Nível de usoRequisitos para avançar para o nívelUso máximo por mês
Compra de créditoEspera após a primeira compra
GrátisN/A0 dias$10
Build Nível 1$50 dias$100
Build Nível 2$407 dias$500
Build Nível 3$2007 dias$1,000
Build Nível 4$40014 dias$5,000
ScaleN/AN/AN/A

Limites de taxa

Nossos limites de taxa são atualmente medidos em solicitações por minuto, tokens por minuto e tokens por dia para cada classe de modelo. Se você exceder qualquer um dos limites de taxa, receberá um erro 429. Clique no nível de limite de taxa para ver os limites de taxa relevantes.

Nível do ModeloSolicitações por minuto (RPM)Tokens por minuto (TPM)Tokens por dia (TPD)
Claude 3 Haiku525,000300,000
Claude 3 Sonnet520,000300,000
Claude 3 Opus510,000300,000

Cabeçalhos de resposta

A resposta da API inclui cabeçalhos que mostram o limite de taxa aplicado, o uso atual e quando o limite será redefinido.

Os seguintes cabeçalhos são retornados:

CabeçalhoDescrição
anthropic-ratelimit-requests-limitO número máximo de solicitações permitidas dentro da janela de limite de taxa.
anthropic-ratelimit-requests-remainingO número de solicitações restantes dentro da janela de limite de taxa atual.
anthropic-ratelimit-requests-resetO tempo em que a janela de limite de taxa de solicitação será redefinida, fornecido no formato RFC 3339.
anthropic-ratelimit-tokens-limitO número máximo de tokens permitidos dentro da janela de limite de taxa.
anthropic-ratelimit-tokens-remainingO número de tokens restantes, arredondado para o milhar mais próximo, dentro da janela de limite de taxa atual.
anthropic-ratelimit-tokens-resetO tempo em que a janela de limite de taxa de tokens será redefinida, fornecido no formato RFC 3339.

Os cabeçalhos de limite de taxa de tokens exibem os valores para o limite (diário ou por minuto) com menos tokens restantes. Por exemplo, se você excedeu o limite diário de tokens, mas não enviou nenhum token no último minuto, os cabeçalhos conterão os valores de limite de taxa de tokens diários.