使用 API
速率限制
为了减少滥用并管理我们API的容量,我们对组织使用Claude API的数量实施了限制。
我们有两种类型的限制:
- 使用限制设置了组织每月API使用的最大成本。
- 速率限制限制了组织在规定时间内可以发出的API请求数量。
关于我们的限制
- 限制旨在防止API滥用,同时最大限度地减少对常见客户使用模式的影响。
- 限制由使用层级定义,每个层级都有不同的使用和速率限制。
- 当您在使用API时达到某些阈值时,您的组织将自动提升层级。
限制是在组织级别设置的。您可以在Anthropic控制台的计划和账单中查看您组织的限制。 - 您可能会在较短的时间间隔内达到速率限制。例如,每分钟60个请求(RPM)的速率可能会被强制执行为每秒1个请求。短时间内大量请求的突发可能会超过速率限制并导致速率限制错误。
- 以下概述的限制是我们的标准限制,适用于”Build” API计划。如果您需要更高的自定义限制,请通过点击Anthropic控制台中的”选择计划”联系销售团队,以转移到我们的自定义”Scale”计划。
- 我们使用令牌桶算法来进行速率限制。
使用限制
每个使用层级都有每个日历月可以使用API的限制。一旦您达到当前层级的使用限制,在您有资格进入下一个层级之前,您将需要等到下个月才能再次使用API。
要有资格进入下一个层级,您必须满足存款要求和强制等待期。更高的层级需要更长的等待期。请注意,为了最大限度地降低超额资金的风险,您不能存入超过您每月使用限制的金额。
提升层级的要求
使用层级 | 信用购买 | 首次购买后等待时间 | 每月最大使用量 |
---|---|---|---|
免费 | 不适用 | 0天 | 10美元 |
Build 层级1 | 5美元 | 0天 | 100美元 |
Build 层级2 | 40美元 | 7天 | 500美元 |
Build 层级3 | 200美元 | 7天 | 1,000美元 |
Build 层级4 | 400美元 | 14天 | 5,000美元 |
Scale | 不适用 | 不适用 | 不适用 |
速率限制
我们的速率限制目前以每分钟请求数、每分钟令牌数和每天令牌数来衡量每个模型类别。如果您超过任何速率限制,您将收到429错误。点击速率限制层级以查看相关速率限制。
模型层级 | 每分钟请求数 (RPM) | 每分钟令牌数 (TPM) | 每天令牌数 (TPD) |
---|---|---|---|
Claude 3.5 Sonnet | 5 | 20,000 | 300,000 |
Claude 3 Opus | 5 | 10,000 | 300,000 |
Claude 3 Sonnet | 5 | 20,000 | 300,000 |
Claude 3 Haiku | 5 | 25,000 | 300,000 |
响应头
API响应包含显示强制执行的速率限制、当前使用情况以及限制何时重置的头部。
返回以下头部:
头部 | 描述 |
---|---|
anthropic-ratelimit-requests-limit | 在任何速率限制期内允许的最大请求数。 |
anthropic-ratelimit-requests-remaining | 在被速率限制之前剩余的请求数。 |
anthropic-ratelimit-requests-reset | 请求速率限制将重置的时间,以RFC 3339格式提供。 |
anthropic-ratelimit-tokens-limit | 在任何速率限制期内允许的最大令牌数。 |
anthropic-ratelimit-tokens-remaining | 在被速率限制之前剩余的令牌数(四舍五入到最接近的千位)。 |
anthropic-ratelimit-tokens-reset | 令牌速率限制将重置的时间,以RFC 3339格式提供。 |
retry-after | 您可以重试请求的秒数。 |
令牌速率限制头部显示剩余令牌较少的限制(每日或每分钟)的值。例如,如果您已超过每日令牌限制但在最后一分钟内没有发送任何令牌,头部将包含每日令牌速率限制值。