2種類の制限があります:

  1. 使用制限 は、組織がAPI使用に対して請求される月額の上限を設定します。
  2. レート制限 は、組織が一定期間内に行えるAPIリクエストの数を制限します。

制限について

  • 制限は、一般的な顧客の使用パターンへの影響を最小限に抑えつつ、APIの悪用を防ぐように設計されています。
  • 制限は使用層によって定義され、各層には異なる使用制限とレート制限が関連付けられています。
  • APIを使用する際に一定のしきい値に達すると、組織は自動的に上位の層に移行します。
    制限は組織レベルで設定されます。組織の制限は、ConsolePlans and Billingで確認できます。
  • より短い時間間隔でレート制限に達する場合があります。例えば、1分あたり60リクエスト(RPM)のレートは、1秒あたり1リクエストとして適用される場合があります。大量のリクエストを短時間で行うと、レート制限を超えてレート制限エラーが発生する可能性があります。
  • 以下に概説する制限は標準的な制限であり、“Build”APIプランに適用されます。より高い、カスタムの制限を求める場合は、コンソールで「プランを選択」をクリックし、カスタムの”Scale”プランに移行して営業にお問い合わせください。
  • 現在、すべてのClaudeモデルで同じ使用制限とレート制限が適用されています。

使用制限

各使用層には、毎月のAPI使用量に制限があります。層の使用制限に達すると、次の層の資格を得るまで、次の月までAPIを使用できなくなります。

次の層の資格を得るには、デポジットの要件と必須の待機期間を満たす必要があります。上位の層になるほど、待機期間が長くなります。なお、口座への過剰入金のリスクを最小限に抑えるため、月間使用制限を超える額をデポジットすることはできません。

使用層層に進むための要件月間最大使用量
クレジット購入初回購入後の待機期間
無料該当なし0日$10
Build Tier 1$50日$100
Build Tier 2$407日$500
Build Tier 3$2007日$1,000
Build Tier 4$40014日$5,000
Scale該当なし該当なし該当なし

レート制限

現在、レート制限は各モデルクラスの1分あたりのリクエスト数、1分あたりのトークン数、1日あたりのトークン数で測定されています。レート制限のいずれかを超えると、429エラーが発生します。関連するレート制限を表示するには、レート制限層をクリックしてください。

モデル層1分あたりのリクエスト数(RPM)1分あたりのトークン数(TPM)1日あたりのトークン数(TPD)
Claude 3 Haiku525,000300,000
Claude 3 Sonnet520,000300,000
Claude 3 Opus510,000300,000

レスポンスヘッダー

APIレスポンスには、適用されるレート制限、現在の使用状況、制限がリセットされるタイミングを示すヘッダーが含まれています。

以下のヘッダーが返されます:

ヘッダー説明
anthropic-ratelimit-requests-limitレート制限ウィンドウ内で許可されるリクエストの最大数。
anthropic-ratelimit-requests-remaining現在のレート制限ウィンドウ内で残っているリクエスト数。
anthropic-ratelimit-requests-resetリクエストレート制限ウィンドウがリセットされる時刻。RFC 3339形式で提供されます。
anthropic-ratelimit-tokens-limitレート制限ウィンドウ内で許可されるトークンの最大数。
anthropic-ratelimit-tokens-remaining現在のレート制限ウィンドウ内で残っているトークン数。千の位で四捨五入されます。
anthropic-ratelimit-tokens-resetトークンレート制限ウィンドウがリセットされる時刻。RFC 3339形式で提供されます。

トークンレート制限ヘッダーには、残りのトークン数が少ない方の制限(1日または1分あたり)の値が表示されます。例えば、1日のトークン制限を超えているが、過去1分間にトークンを送信していない場合、ヘッダーには1日のトークンレート制限値が含まれます。