トークンカウントはベータ版です

この機能にアクセスするには、APIリクエストにanthropic-beta: token-counting-2024-11-01ヘッダーを含めるか、SDKコールでclient.beta.messages.count_tokensを使用してください。

今後数週間にわたってこのオープンベータを改良していく予定ですので、フィードバックをお待ちしています。このフォームを使用してアイデアや提案をお寄せください。

トークンカウントを使用すると、メッセージをClaudeに送信する前にトークン数を確認でき、プロンプトと使用状況について十分な情報に基づいた判断を下すことができます。トークンカウントを使用することで、以下のことが可能になります:

  • レート制限とコストを事前に管理
  • スマートなモデルルーティングの判断
  • プロンプトを特定の長さに最適化

メッセージのトークン数を数える方法

トークンカウントエンドポイントは、システムプロンプト、ツール画像PDFのサポートを含む、メッセージ作成と同じ構造化された入力リストを受け付けます。レスポンスには入力トークンの合計数が含まれます。

トークン数は推定値として考える必要があります。場合によっては、メッセージ作成時に実際に使用される入力トークン数が若干異なる可能性があります。

サポートされているモデル

トークンカウントエンドポイントは以下のモデルをサポートしています:

  • Claude 3.5 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Haiku
  • Claude 3 Opus

基本的なメッセージのトークンを数える

JSON
{ "input_tokens": 14 }

ツールを含むメッセージのトークンを数える

JSON
{ "input_tokens": 403 }

画像を含むメッセージのトークンを数える

JSON
{ "input_tokens": 1551 }

PDFを含むメッセージのトークンを数える

JSON
{ "input_tokens": 2188 }

トークンカウントAPIは、メッセージAPIと同じ制限でPDFをサポートしています。


価格設定とレート制限

トークンカウントは無料で使用できますが、使用量層に基づいて1分あたりのリクエスト数の制限があります。より高い制限が必要な場合は、Anthropic Consoleからセールスにお問い合わせください。

使用量層1分あたりのリクエスト数(RPM)
1100
22,000
34,000
48,000

トークンカウントとメッセージ作成には別個の独立したレート制限があります - 一方の使用量は他方の制限にはカウントされません。