我们有两种类型的限制:

  1. 使用限制 设置组织每月可以产生的 API 使用费用的最高限额。
  2. 速率限制 限制组织在一定时间内可以发出的 API 请求数量。

关于我们的限制

  • 限制旨在防止 API 滥用,同时尽量减少对常见客户使用模式的影响。
  • 限制按使用等级定义,每个等级与一组不同的使用和速率限制相关联。
  • 在使用 API 时,当您达到某些阈值时,您的组织将自动提升等级。
  • 限制在组织级别设置。您可以在 Console计划和计费 中查看您组织的限制。
  • 您可能会在较短的时间间隔内达到速率限制。例如,每分钟 60 个请求 (RPM) 的速率可能会被强制为每秒 1 个请求。高容量的短时间请求突发可能会超过速率限制并导致速率限制错误。
  • 以下概述的限制是我们的标准限制,适用于 “Build” API 计划。如果您正在寻求更高的自定义限制,请点击 控制台 中的”选择计划”,联系销售人员转移到我们的自定义 “Scale” 计划。
  • 所有 Claude 模型目前具有相同的使用和速率限制。

使用限制

每个使用等级都有一个限制,规定您每个日历月可以使用 API 的数量。一旦达到您所在等级的使用限制,在您有资格升级到下一个等级之前,您必须等到下个月才能再次使用 API。

要获得下一个等级的资格,您必须满足存款要求和强制等待期。更高的等级需要更长的等待期。请注意,为了最大限度地降低您的账户超额注资的风险,您存款的金额不能超过您的每月使用限额。

使用等级升级到该等级的要求首次购买后的等待时间
信用购买等待时间
免费不适用0 天$10
Build Tier 1$50 天$100
Build Tier 2$407 天$500
Build Tier 3$2007 天$1,000
Build Tier 4$40014 天$5,000
Scale不适用不适用不适用

速率限制

我们的速率限制目前以每个模型类别的每分钟请求数、每分钟令牌数和每天令牌数来衡量。如果您超过任何速率限制,您将收到 429 错误。点击速率限制等级以查看相关的速率限制。

模型等级每分钟请求数 (RPM)每分钟令牌数 (TPM)每天令牌数 (TPD)
Claude 3 Haiku525,000300,000
Claude 3 Sonnet520,000300,000
Claude 3 Opus510,000300,000

响应头

API 响应包括显示强制执行的速率限制、当前使用情况以及限制将在何时重置的标头。

返回以下标头:

标头描述
anthropic-ratelimit-requests-limit在速率限制窗口内允许的最大请求数。
anthropic-ratelimit-requests-remaining在当前速率限制窗口内剩余的请求数。
anthropic-ratelimit-requests-reset请求速率限制窗口将重置的时间,以 RFC 3339 格式提供。
anthropic-ratelimit-tokens-limit在速率限制窗口内允许的最大令牌数。
anthropic-ratelimit-tokens-remaining在当前速率限制窗口内剩余的令牌数,四舍五入到最接近的千位。
anthropic-ratelimit-tokens-reset令牌速率限制窗口将重置的时间,以 RFC 3339 格式提供。

令牌速率限制标头显示剩余令牌较少的限制(每日或每分钟)的值。例如,如果您已超过每日令牌限制但在最后一分钟内未发送任何令牌,则标头将包含每日令牌速率限制值。