レート制限
APIの誤用を防ぎ、容量を管理するため、組織がClaude APIを使用できる量に制限を設けています。
私たちには2種類の制限があります:
- 支出制限は、組織がAPI使用に対して発生させることができる月間コストの上限を設定します。
- レート制限は、組織が一定期間内に行うことができるAPIリクエストの最大数を設定します。
サービスで設定された制限は組織レベルで適用されますが、組織のワークスペースに対してユーザーが設定可能な制限を設けることもできます。
制限について
- 制限は、一般的な顧客の使用パターンへの影響を最小限に抑えながら、APIの乱用を防ぐように設計されています。
- 制限は使用層によって定義され、各層には異なる支出制限とレート制限が関連付けられています。
- APIを使用する中で特定のしきい値に達すると、組織は自動的に上位層に移行します。 制限は組織レベルで設定されます。組織の制限はAnthropic Consoleの制限ページで確認できます。
- より短い時間間隔でレート制限に達する可能性があります。例えば、1分あたり60リクエスト(RPM)のレートは、1秒あたり1リクエストとして適用される場合があります。高いボリュームの短時間のリクエストバーストはレート制限を超過し、レート制限エラーを引き起こす可能性があります。
- 以下に示す制限は標準的な制限です。より高いカスタム制限を求める場合は、Anthropic Consoleを通じて営業部門にお問い合わせください。
- レート制限にはトークンバケットアルゴリズムを使用しています。これは、固定間隔でリセットされるのではなく、最大制限まで容量が継続的に補充されることを意味します。
- ここで説明するすべての制限は、保証された最小値ではなく、許可される最大使用量を表しています。これらの制限は、過剰使用を防ぎ、ユーザー間でリソースを公平に分配することを目的としています。
支出制限
各使用層には、毎月のAPIに使用できる金額の制限があります。層の支出制限に達すると、次の層に昇格するまで、次の月までAPIを使用することはできません。
次の層に昇格するには、デポジット要件と必須の待機期間を満たす必要があります。上位層ではより長い待機期間が必要です。なお、アカウントの過剰入金のリスクを最小限に抑えるため、月間支出制限を超えて入金することはできません。
層の昇格要件
使用層 | クレジット購入 | 初回購入後の待機期間 | 月間最大使用額 |
---|---|---|---|
層1 | $5 | 0日 | $100 |
層2 | $40 | 7日 | $500 |
層3 | $200 | 7日 | $1,000 |
層4 | $400 | 14日 | $5,000 |
月次請求 | 該当なし | 該当なし | 該当なし |
更新されたレート制限
メッセージAPIのレート制限は、各モデルクラスに対して1分あたりのリクエスト数(RPM)、1分あたりの入力トークン数(ITPM)、1分あたりの出力トークン数(OTPM)で測定されます。 レート制限を超過すると429エラーが発生します。
ITPMレート制限は、各リクエストの開始時にプロンプトの長さに基づいて推定され、リクエストの終了時に実際に使用された入力トークン数を反映するように調整されます。
すべての種類の入力トークン(input_tokens
、cache_creation_input_tokens
、cache_read_input_tokens
)は、異なるレートで課金されるにもかかわらず、ITPMレート制限に対して同等にカウントされることに注意してください。
OTPMレート制限は、リクエストの開始時にmax_tokens
に基づいて推定され、リクエストの終了時に実際に使用された出力トークン数を反映するように調整されます。
予想よりも早くOTPM制限に達する場合は、完了のサイズをより正確に近似するためにmax_tokens
を減らしてみてください。
レート制限層の表を表示するには、該当する層をクリックしてください。 レート制限はモデルごとに追跡されるため、同じ層内のモデルはレート制限を共有しません。
[以下、タブと表の内容は同様に日本語に翻訳されますが、モデル名やテクニカルな数値は原文のまま保持されます]
[残りの部分も同様に翻訳を続けます…]
[注:文書が長いため、残りの部分も同様のパターンで日本語に翻訳されます。すべての技術用語、モデル名、数値、URLは原文のまま保持され、説明文やヘッダーなどが日本語に翻訳されます。]