APIの使用
レート制限
APIの悪用を防ぎ、容量を管理するために、組織がClaude APIをどの程度使用できるかについて制限を設けています。
2種類の制限があります:
- 使用制限 は、組織がAPI使用に対して請求される月額の上限を設定します。
- レート制限 は、組織が一定期間内に行えるAPIリクエストの数を制限します。
制限について
- 制限は、一般的な顧客の使用パターンへの影響を最小限に抑えつつ、APIの悪用を防ぐように設計されています。
- 制限は使用層によって定義され、各層には異なる使用制限とレート制限が関連付けられています。
- APIを使用する際に一定のしきい値に達すると、組織は自動的に上位の層に移行します。
制限は組織レベルで設定されます。組織の制限は、ConsoleのPlans and Billingで確認できます。 - より短い時間間隔でレート制限に達する場合があります。例えば、1分あたり60リクエスト(RPM)のレートは、1秒あたり1リクエストとして適用される場合があります。大量のリクエストを短時間で行うと、レート制限を超えてレート制限エラーが発生する可能性があります。
- 以下に概説する制限は標準的な制限であり、“Build”APIプランに適用されます。より高い、カスタムの制限を求める場合は、コンソールで「プランを選択」をクリックし、カスタムの”Scale”プランに移行して営業にお問い合わせください。
- 現在、すべてのClaudeモデルで同じ使用制限とレート制限が適用されています。
使用制限
各使用層には、毎月のAPI使用量に制限があります。層の使用制限に達すると、次の層の資格を得るまで、次の月までAPIを使用できなくなります。
次の層の資格を得るには、デポジットの要件と必須の待機期間を満たす必要があります。上位の層になるほど、待機期間が長くなります。なお、口座への過剰入金のリスクを最小限に抑えるため、月間使用制限を超える額をデポジットすることはできません。
使用層 | 層に進むための要件 | 月間最大使用量 | |
---|---|---|---|
クレジット購入 | 初回購入後の待機期間 | ||
無料 | 該当なし | 0日 | $10 |
Build Tier 1 | $5 | 0日 | $100 |
Build Tier 2 | $40 | 7日 | $500 |
Build Tier 3 | $200 | 7日 | $1,000 |
Build Tier 4 | $400 | 14日 | $5,000 |
Scale | 該当なし | 該当なし | 該当なし |
レート制限
現在、レート制限は各モデルクラスの1分あたりのリクエスト数、1分あたりのトークン数、1日あたりのトークン数で測定されています。レート制限のいずれかを超えると、429エラーが発生します。関連するレート制限を表示するには、レート制限層をクリックしてください。
モデル層 | 1分あたりのリクエスト数(RPM) | 1分あたりのトークン数(TPM) | 1日あたりのトークン数(TPD) |
---|---|---|---|
Claude 3 Haiku | 5 | 25,000 | 300,000 |
Claude 3 Sonnet | 5 | 20,000 | 300,000 |
Claude 3 Opus | 5 | 10,000 | 300,000 |
レスポンスヘッダー
APIレスポンスには、適用されるレート制限、現在の使用状況、制限がリセットされるタイミングを示すヘッダーが含まれています。
以下のヘッダーが返されます:
ヘッダー | 説明 |
---|---|
anthropic-ratelimit-requests-limit | レート制限ウィンドウ内で許可されるリクエストの最大数。 |
anthropic-ratelimit-requests-remaining | 現在のレート制限ウィンドウ内で残っているリクエスト数。 |
anthropic-ratelimit-requests-reset | リクエストレート制限ウィンドウがリセットされる時刻。RFC 3339形式で提供されます。 |
anthropic-ratelimit-tokens-limit | レート制限ウィンドウ内で許可されるトークンの最大数。 |
anthropic-ratelimit-tokens-remaining | 現在のレート制限ウィンドウ内で残っているトークン数。千の位で四捨五入されます。 |
anthropic-ratelimit-tokens-reset | トークンレート制限ウィンドウがリセットされる時刻。RFC 3339形式で提供されます。 |
トークンレート制限ヘッダーには、残りのトークン数が少ない方の制限(1日または1分あたり)の値が表示されます。例えば、1日のトークン制限を超えているが、過去1分間にトークンを送信していない場合、ヘッダーには1日のトークンレート制限値が含まれます。