我们有两种类型的限制:

  1. 使用限制设置了组织每月API使用的最大成本。
  2. 速率限制限制了组织在规定时间内可以发出的API请求数量。

关于我们的限制

  • 限制旨在防止API滥用,同时最大限度地减少对常见客户使用模式的影响。
  • 限制由使用层级定义,每个层级都有不同的使用和速率限制。
  • 当您在使用API时达到某些阈值时,您的组织将自动提升层级。
    限制是在组织级别设置的。您可以在Anthropic控制台计划和账单中查看您组织的限制。
  • 您可能会在较短的时间间隔内达到速率限制。例如,每分钟60个请求(RPM)的速率可能会被强制执行为每秒1个请求。短时间内大量请求的突发可能会超过速率限制并导致速率限制错误。
  • 以下概述的限制是我们的标准限制,适用于”Build” API计划。如果您需要更高的自定义限制,请通过点击Anthropic控制台中的”选择计划”联系销售团队,以转移到我们的自定义”Scale”计划。
  • 我们使用令牌桶算法来进行速率限制。

使用限制

每个使用层级都有每个日历月可以使用API的限制。一旦您达到当前层级的使用限制,在您有资格进入下一个层级之前,您将需要等到下个月才能再次使用API。

要有资格进入下一个层级,您必须满足存款要求和强制等待期。更高的层级需要更长的等待期。请注意,为了最大限度地降低超额资金的风险,您不能存入超过您每月使用限制的金额。

提升层级的要求

使用层级信用购买首次购买后等待时间每月最大使用量
免费不适用0天10美元
Build 层级15美元0天100美元
Build 层级240美元7天500美元
Build 层级3200美元7天1,000美元
Build 层级4400美元14天5,000美元
Scale不适用不适用不适用

速率限制

我们的速率限制目前以每分钟请求数、每分钟令牌数和每天令牌数来衡量每个模型类别。如果您超过任何速率限制,您将收到429错误。点击速率限制层级以查看相关速率限制。

模型层级每分钟请求数 (RPM)每分钟令牌数 (TPM)每天令牌数 (TPD)
Claude 3.5 Sonnet520,000300,000
Claude 3 Opus510,000300,000
Claude 3 Sonnet520,000300,000
Claude 3 Haiku525,000300,000

响应头

API响应包含显示强制执行的速率限制、当前使用情况以及限制何时重置的头部。

返回以下头部:

头部描述
anthropic-ratelimit-requests-limit在任何速率限制期内允许的最大请求数。
anthropic-ratelimit-requests-remaining在被速率限制之前剩余的请求数。
anthropic-ratelimit-requests-reset请求速率限制将重置的时间,以RFC 3339格式提供。
anthropic-ratelimit-tokens-limit在任何速率限制期内允许的最大令牌数。
anthropic-ratelimit-tokens-remaining在被速率限制之前剩余的令牌数(四舍五入到最接近的千位)。
anthropic-ratelimit-tokens-reset令牌速率限制将重置的时间,以RFC 3339格式提供。
retry-after您可以重试请求的秒数。

令牌速率限制头部显示剩余令牌较少的限制(每日或每分钟)的值。例如,如果您已超过每日令牌限制但在最后一分钟内没有发送任何令牌,头部将包含每日令牌速率限制值。