Claudeで構築する
トークンカウント
トークンカウントを使用すると、メッセージをClaudeに送信する前にメッセージ内のトークン数を確認でき、プロンプトと使用量について十分な情報に基づいた判断を下すことができます。トークンカウントにより、以下のことが可能になります:
- レート制限とコストを事前に管理
- スマートなモデルルーティングの判断
- プロンプトを特定の長さに最適化
メッセージのトークン数を数える方法
トークンカウントエンドポイントは、システムプロンプト、ツール、画像、PDFのサポートを含む、メッセージ作成と同じ構造化された入力リストを受け付けます。レスポンスには入力トークンの合計数が含まれます。
トークン数は推定値として考える必要があります。場合によっては、メッセージ作成時に実際に使用される入力トークン数が若干異なる可能性があります。
サポートされているモデル
トークンカウントエンドポイントは以下のモデルをサポートしています:
- Claude 3.5 Sonnet
- Claude 3.5 Haiku
- Claude 3 Haiku
- Claude 3 Opus
基本的なメッセージのトークンを数える
JSON
ツールを含むメッセージのトークンを数える
JSON
画像を含むメッセージのトークンを数える
JSON
PDFを含むメッセージのトークンを数える
JSON
トークンカウントAPIは、メッセージAPIと同じ制限事項でPDFをサポートしています。
価格設定とレート制限
トークンカウントは無料で使用できますが、使用量層に基づく1分あたりのリクエスト制限があります。より高い制限が必要な場合は、Anthropic Consoleを通じて営業部門にお問い合わせください。
使用量層 | 1分あたりのリクエスト数(RPM) |
---|---|
1 | 100 |
2 | 2,000 |
3 | 4,000 |
4 | 8,000 |
トークンカウントとメッセージ作成は別個の独立したレート制限を持っています - 一方の使用量は他方の制限にはカウントされません。