Temos dois tipos de limites:

  1. Limites de gastos estabelecem um custo mensal máximo que uma organização pode incorrer pelo uso da API.
  2. Limites de taxa restringem o número de solicitações de API que uma organização pode fazer durante um período de tempo definido.

Aplicamos limites configurados pelo serviço no nível da organização, mas você também pode definir limites configuráveis pelo usuário para os espaços de trabalho da sua organização.

Sobre nossos limites

  • Os limites são projetados para prevenir o abuso da API, minimizando o impacto nos padrões comuns de uso do cliente.
  • Os limites são definidos por nível de uso, onde cada nível está associado a um conjunto diferente de limites de gastos e taxas.
  • Sua organização aumentará de nível automaticamente conforme você atingir certos limites ao usar a API.
    Os limites são definidos no nível da organização. Você pode ver os limites da sua organização na página de Limites no Console Anthropic.
  • Você pode atingir limites de taxa em intervalos de tempo mais curtos. Por exemplo, uma taxa de 60 solicitações por minuto (RPM) pode ser aplicada como 1 solicitação por segundo. Rajadas curtas de solicitações em alto volume podem ultrapassar o limite de taxa e resultar em erros de limite de taxa.
  • Os limites descritos abaixo são nossos limites padrão. Se você estiver buscando limites personalizados mais altos, entre em contato com as vendas através do Console Anthropic.
  • Usamos o algoritmo de balde de tokens para fazer a limitação de taxa.

Limites de gastos

Cada nível de uso tem um limite de quanto você pode gastar na API a cada mês do calendário. Uma vez que você atinja o limite de gastos do seu nível, até se qualificar para o próximo nível, você terá que esperar até o próximo mês para poder usar a API novamente.

Para se qualificar para o próximo nível, você deve atender a um requisito de depósito e um período de espera obrigatório. Níveis mais altos exigem períodos de espera mais longos. Observe que, para minimizar o risco de superfinanciar sua conta, você não pode depositar mais do que seu limite mensal de gastos.

Requisitos para avançar de nível

Nível de UsoCompra de CréditoEspera Após Primeira CompraUso Máximo por Mês
Nível 1$50 dias$100
Nível 2$407 dias$500
Nível 3$2007 dias$1.000
Nível 4$40014 dias$5.000
Faturamento MensalN/AN/AN/A

Limites de taxa

Nossos limites de taxa são atualmente medidos em solicitações por minuto, tokens por minuto e tokens por dia para cada classe de modelo. Se você exceder qualquer um dos limites de taxa, receberá um erro 429. Clique no nível de limite de taxa para ver os limites relevantes.

Nível do ModeloSolicitações por minuto (RPM)Tokens por minuto (TPM)Tokens por dia (TPD)
Claude 3.5 Sonnet5040.0001.000.000
Claude 3 Opus5020.0001.000.000
Claude 3 Sonnet5040.0001.000.000
Claude 3 Haiku5050.0005.000.000

Definindo limites mais baixos para Espaços de Trabalho

Para proteger os Espaços de Trabalho em sua Organização contra possível uso excessivo, você pode definir limites personalizados de gastos e taxas por Espaço de Trabalho.

Exemplo: Se o limite da sua Organização for de 80.000 tokens por minuto, você pode limitar um Espaço de Trabalho a 30.000 tokens por minuto. Isso protege outros Espaços de Trabalho de possível uso excessivo e garante uma distribuição mais equitativa de recursos em sua Organização. Os 50.000 tokens por minuto restantes (ou mais, se esse Espaço de Trabalho não usar o limite) ficam então disponíveis para outros Espaços de Trabalho usarem.

Nota:

  • Você não pode definir limites no Espaço de Trabalho padrão.
  • Se não forem definidos, os limites do Espaço de Trabalho correspondem ao limite da Organização.
  • Os limites em toda a Organização sempre se aplicam, mesmo que os limites do Espaço de Trabalho somem mais.

Cabeçalhos de resposta

A resposta da API inclui cabeçalhos que mostram o limite de taxa aplicado, o uso atual e quando o limite será redefinido.

Os seguintes cabeçalhos são retornados:

CabeçalhoDescrição
anthropic-ratelimit-requests-limitO número máximo de solicitações permitidas dentro de qualquer período de limite de taxa.
anthropic-ratelimit-requests-remainingO número de solicitações restantes antes de ser limitado pela taxa.
anthropic-ratelimit-requests-resetO momento em que o limite de taxa de solicitações será redefinido, fornecido no formato RFC 3339.
anthropic-ratelimit-tokens-limitO número máximo de tokens permitidos dentro de qualquer período de limite de taxa.
anthropic-ratelimit-tokens-remainingO número de tokens restantes (arredondado para o milhar mais próximo) antes de ser limitado pela taxa.
anthropic-ratelimit-tokens-resetO momento em que o limite de taxa de tokens será redefinido, fornecido no formato RFC 3339.
retry-afterO número de segundos até que você possa tentar a solicitação novamente.

Os cabeçalhos de limite de taxa de tokens exibem os valores para o limite (diário ou por minuto) com menos tokens restantes. Por exemplo, se você excedeu o limite diário de tokens, mas não enviou nenhum token no último minuto, os cabeçalhos conterão os valores do limite de taxa diário de tokens.