Claudeで構築する
トークンカウント(ベータ)
トークンカウントはベータ版です
この機能にアクセスするには、APIリクエストにanthropic-beta: token-counting-2024-11-01
ヘッダーを含めるか、SDKコールでclient.beta.messages.count_tokens
を使用してください。
今後数週間にわたってこのオープンベータを改良していく予定ですので、フィードバックをお待ちしています。このフォームを使用してアイデアや提案をお寄せください。
トークンカウントを使用すると、メッセージをClaudeに送信する前にトークン数を確認でき、プロンプトと使用状況について十分な情報に基づいた判断を下すことができます。トークンカウントを使用することで、以下のことが可能になります:
- レート制限とコストを事前に管理
- スマートなモデルルーティングの判断
- プロンプトを特定の長さに最適化
メッセージのトークン数を数える方法
トークンカウントエンドポイントは、システムプロンプト、ツール、画像、PDFのサポートを含む、メッセージ作成と同じ構造化された入力リストを受け付けます。レスポンスには入力トークンの合計数が含まれます。
トークン数は推定値として考える必要があります。場合によっては、メッセージ作成時に実際に使用される入力トークン数が若干異なる可能性があります。
サポートされているモデル
トークンカウントエンドポイントは以下のモデルをサポートしています:
- Claude 3.5 Sonnet
- Claude 3.5 Haiku
- Claude 3 Haiku
- Claude 3 Opus
基本的なメッセージのトークンを数える
JSON
ツールを含むメッセージのトークンを数える
JSON
画像を含むメッセージのトークンを数える
JSON
PDFを含むメッセージのトークンを数える
JSON
トークンカウントAPIは、メッセージAPIと同じ制限でPDFをサポートしています。
価格設定とレート制限
トークンカウントは無料で使用できますが、使用量層に基づいて1分あたりのリクエスト数の制限があります。より高い制限が必要な場合は、Anthropic Consoleからセールスにお問い合わせください。
使用量層 | 1分あたりのリクエスト数(RPM) |
---|---|
1 | 100 |
2 | 2,000 |
3 | 4,000 |
4 | 8,000 |
トークンカウントとメッセージ作成には別個の独立したレート制限があります - 一方の使用量は他方の制限にはカウントされません。