使用 API
速率限制
為了減輕濫用並管理我們 API 的容量,我們對組織使用 Claude API 的程度實施了限制。
我們有兩種類型的限制:
- 使用限制設定組織每月 API 使用的最高成本。
- 速率限制限制組織在特定時間內可以發出的 API 請求數量。
關於我們的限制
- 限制旨在防止 API 濫用,同時最大程度地減少對常見客戶使用模式的影響。
- 限制由使用層級定義,每個層級都與不同的使用和速率限制相關聯。
- 當您在使用 API 時達到某些閾值,您的組織將自動提升層級。
限制是在組織層面設置的。您可以在 Anthropic Console 的計劃和計費中查看您組織的限制。 - 您可能會在較短的時間間隔內達到速率限制。例如,每分鐘 60 個請求(RPM)的速率可能會被強制執行為每秒 1 個請求。短時間內大量的請求可能會超過速率限制並導致速率限制錯誤。
- 以下概述的限制是我們的標準限制,適用於「Build」API 計劃。如果您需要更高的自定義限制,請通過點擊 Anthropic Console 中的「選擇計劃」聯繫銷售團隊,以轉移到我們的自定義「Scale」計劃。
- 我們使用令牌桶算法來進行速率限制。
使用限制
每個使用層級都有每個日曆月可以使用 API 的限制。一旦您達到您所在層級的使用限制,在您符合下一個層級之前,您將需要等到下個月才能再次使用 API。
要符合下一個層級的資格,您必須滿足存款要求和強制等待期。較高層級需要更長的等待期。請注意,為了最小化超額資金的風險,您不能存入超過您每月使用限制的金額。
提升層級的要求
使用層級 | 信用購買 | 首次購買後等待 | 每月最大使用量 |
---|---|---|---|
免費 | 不適用 | 0 天 | 10 美元 |
Build 層級 1 | 5 美元 | 0 天 | 100 美元 |
Build 層級 2 | 40 美元 | 7 天 | 500 美元 |
Build 層級 3 | 200 美元 | 7 天 | 1,000 美元 |
Build 層級 4 | 400 美元 | 14 天 | 5,000 美元 |
Scale | 不適用 | 不適用 | 不適用 |
速率限制
我們目前的速率限制以每分鐘請求數、每分鐘令牌數和每天令牌數來衡量每個模型類別。如果您超過任何速率限制,您將收到 429 錯誤。點擊速率限制層級以查看相關速率限制。
模型層級 | 每分鐘請求數 (RPM) | 每分鐘令牌數 (TPM) | 每天令牌數 (TPD) |
---|---|---|---|
Claude 3.5 Sonnet | 5 | 20,000 | 300,000 |
Claude 3 Opus | 5 | 10,000 | 300,000 |
Claude 3 Sonnet | 5 | 20,000 | 300,000 |
Claude 3 Haiku | 5 | 25,000 | 300,000 |
響應標頭
API 響應包含顯示強制執行的速率限制、當前使用情況以及限制何時重置的標頭。
返回以下標頭:
標頭 | 描述 |
---|---|
anthropic-ratelimit-requests-limit | 在任何速率限制期內允許的最大請求數。 |
anthropic-ratelimit-requests-remaining | 在被速率限制之前剩餘的請求數。 |
anthropic-ratelimit-requests-reset | 請求速率限制將重置的時間,以 RFC 3339 格式提供。 |
anthropic-ratelimit-tokens-limit | 在任何速率限制期內允許的最大令牌數。 |
anthropic-ratelimit-tokens-remaining | 在被速率限制之前剩餘的令牌數(四捨五入到最接近的千位)。 |
anthropic-ratelimit-tokens-reset | 令牌速率限制將重置的時間,以 RFC 3339 格式提供。 |
retry-after | 您可以重試請求的秒數。 |
令牌速率限制標頭顯示剩餘令牌較少的限制(每日或每分鐘)的值。例如,如果您已超過每日令牌限制但在最後一分鐘內沒有發送任何令牌,標頭將包含每日令牌速率限制值。