我們有兩種類型的限制:

  1. 使用限制設定組織每月 API 使用的最高成本。
  2. 速率限制限制組織在特定時間內可以發出的 API 請求數量。

關於我們的限制

  • 限制旨在防止 API 濫用,同時最大程度地減少對常見客戶使用模式的影響。
  • 限制由使用層級定義,每個層級都與不同的使用和速率限制相關聯。
  • 當您在使用 API 時達到某些閾值,您的組織將自動提升層級。
    限制是在組織層面設置的。您可以在 Anthropic Console計劃和計費中查看您組織的限制。
  • 您可能會在較短的時間間隔內達到速率限制。例如,每分鐘 60 個請求(RPM)的速率可能會被強制執行為每秒 1 個請求。短時間內大量的請求可能會超過速率限制並導致速率限制錯誤。
  • 以下概述的限制是我們的標準限制,適用於「Build」API 計劃。如果您需要更高的自定義限制,請通過點擊 Anthropic Console 中的「選擇計劃」聯繫銷售團隊,以轉移到我們的自定義「Scale」計劃。
  • 我們使用令牌桶算法來進行速率限制。

使用限制

每個使用層級都有每個日曆月可以使用 API 的限制。一旦您達到您所在層級的使用限制,在您符合下一個層級之前,您將需要等到下個月才能再次使用 API。

要符合下一個層級的資格,您必須滿足存款要求和強制等待期。較高層級需要更長的等待期。請注意,為了最小化超額資金的風險,您不能存入超過您每月使用限制的金額。

提升層級的要求

使用層級信用購買首次購買後等待每月最大使用量
免費不適用0 天10 美元
Build 層級 15 美元0 天100 美元
Build 層級 240 美元7 天500 美元
Build 層級 3200 美元7 天1,000 美元
Build 層級 4400 美元14 天5,000 美元
Scale不適用不適用不適用

速率限制

我們目前的速率限制以每分鐘請求數、每分鐘令牌數和每天令牌數來衡量每個模型類別。如果您超過任何速率限制,您將收到 429 錯誤。點擊速率限制層級以查看相關速率限制。

模型層級每分鐘請求數 (RPM)每分鐘令牌數 (TPM)每天令牌數 (TPD)
Claude 3.5 Sonnet520,000300,000
Claude 3 Opus510,000300,000
Claude 3 Sonnet520,000300,000
Claude 3 Haiku525,000300,000

響應標頭

API 響應包含顯示強制執行的速率限制、當前使用情況以及限制何時重置的標頭。

返回以下標頭:

標頭描述
anthropic-ratelimit-requests-limit在任何速率限制期內允許的最大請求數。
anthropic-ratelimit-requests-remaining在被速率限制之前剩餘的請求數。
anthropic-ratelimit-requests-reset請求速率限制將重置的時間,以 RFC 3339 格式提供。
anthropic-ratelimit-tokens-limit在任何速率限制期內允許的最大令牌數。
anthropic-ratelimit-tokens-remaining在被速率限制之前剩餘的令牌數(四捨五入到最接近的千位)。
anthropic-ratelimit-tokens-reset令牌速率限制將重置的時間,以 RFC 3339 格式提供。
retry-after您可以重試請求的秒數。

令牌速率限制標頭顯示剩餘令牌較少的限制(每日或每分鐘)的值。例如,如果您已超過每日令牌限制但在最後一分鐘內沒有發送任何令牌,標頭將包含每日令牌速率限制值。