使用 API
速率限制
为了防止滥用并管理我们 API 的容量,我们对组织可以使用 Claude API 的数量实施了限制。
我们有两种类型的限制:
- 使用限制 设置组织每月可以产生的 API 使用费用的最高限额。
- 速率限制 限制组织在一定时间内可以发出的 API 请求数量。
关于我们的限制
- 限制旨在防止 API 滥用,同时尽量减少对常见客户使用模式的影响。
- 限制按使用等级定义,每个等级与一组不同的使用和速率限制相关联。
- 在使用 API 时,当您达到某些阈值时,您的组织将自动提升等级。
- 限制在组织级别设置。您可以在 Console 的 计划和计费 中查看您组织的限制。
- 您可能会在较短的时间间隔内达到速率限制。例如,每分钟 60 个请求 (RPM) 的速率可能会被强制为每秒 1 个请求。高容量的短时间请求突发可能会超过速率限制并导致速率限制错误。
- 以下概述的限制是我们的标准限制,适用于 “Build” API 计划。如果您正在寻求更高的自定义限制,请点击 控制台 中的”选择计划”,联系销售人员转移到我们的自定义 “Scale” 计划。
- 所有 Claude 模型目前具有相同的使用和速率限制。
使用限制
每个使用等级都有一个限制,规定您每个日历月可以使用 API 的数量。一旦达到您所在等级的使用限制,在您有资格升级到下一个等级之前,您必须等到下个月才能再次使用 API。
要获得下一个等级的资格,您必须满足存款要求和强制等待期。更高的等级需要更长的等待期。请注意,为了最大限度地降低您的账户超额注资的风险,您存款的金额不能超过您的每月使用限额。
使用等级 | 升级到该等级的要求 | 首次购买后的等待时间 | |
---|---|---|---|
信用购买 | 等待时间 | ||
免费 | 不适用 | 0 天 | $10 |
Build Tier 1 | $5 | 0 天 | $100 |
Build Tier 2 | $40 | 7 天 | $500 |
Build Tier 3 | $200 | 7 天 | $1,000 |
Build Tier 4 | $400 | 14 天 | $5,000 |
Scale | 不适用 | 不适用 | 不适用 |
速率限制
我们的速率限制目前以每个模型类别的每分钟请求数、每分钟令牌数和每天令牌数来衡量。如果您超过任何速率限制,您将收到 429 错误。点击速率限制等级以查看相关的速率限制。
模型等级 | 每分钟请求数 (RPM) | 每分钟令牌数 (TPM) | 每天令牌数 (TPD) |
---|---|---|---|
Claude 3 Haiku | 5 | 25,000 | 300,000 |
Claude 3 Sonnet | 5 | 20,000 | 300,000 |
Claude 3 Opus | 5 | 10,000 | 300,000 |
响应头
API 响应包括显示强制执行的速率限制、当前使用情况以及限制将在何时重置的标头。
返回以下标头:
标头 | 描述 |
---|---|
anthropic-ratelimit-requests-limit | 在速率限制窗口内允许的最大请求数。 |
anthropic-ratelimit-requests-remaining | 在当前速率限制窗口内剩余的请求数。 |
anthropic-ratelimit-requests-reset | 请求速率限制窗口将重置的时间,以 RFC 3339 格式提供。 |
anthropic-ratelimit-tokens-limit | 在速率限制窗口内允许的最大令牌数。 |
anthropic-ratelimit-tokens-remaining | 在当前速率限制窗口内剩余的令牌数,四舍五入到最接近的千位。 |
anthropic-ratelimit-tokens-reset | 令牌速率限制窗口将重置的时间,以 RFC 3339 格式提供。 |
令牌速率限制标头显示剩余令牌较少的限制(每日或每分钟)的值。例如,如果您已超过每日令牌限制但在最后一分钟内未发送任何令牌,则标头将包含每日令牌速率限制值。