トークンカウントを使用すると、メッセージをClaudeに送信する前にメッセージ内のトークン数を確認でき、プロンプトと使用量について十分な情報に基づいた判断を下すことができます。トークンカウントにより、以下のことが可能になります:

  • レート制限とコストを事前に管理
  • スマートなモデルルーティングの判断
  • プロンプトを特定の長さに最適化

メッセージのトークン数を数える方法

トークンカウントエンドポイントは、システムプロンプト、ツール画像PDFのサポートを含む、メッセージ作成と同じ構造化された入力リストを受け付けます。レスポンスには入力トークンの総数が含まれます。

トークン数は推定値として考える必要があります。場合によっては、メッセージ作成時に実際に使用される入力トークン数が若干異なる可能性があります。

サポートされているモデル

トークンカウントエンドポイントは以下のモデルをサポートしています:

  • Claude 3.5 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Haiku
  • Claude 3 Opus

基本的なメッセージのトークン数をカウント

JSON
{ "input_tokens": 14 }

ツールを含むメッセージのトークン数をカウント

JSON
{ "input_tokens": 403 }

画像を含むメッセージのトークン数をカウント

JSON
{ "input_tokens": 1551 }

PDFを含むメッセージのトークン数をカウント

JSON
{ "input_tokens": 2188 }

トークンカウントAPIは、メッセージAPIと同じ制限でPDFをサポートしています。


価格設定とレート制限

トークンカウントは無料で使用できますが、使用量層に基づく1分あたりのリクエスト制限があります。より高い制限が必要な場合は、Anthropic Consoleを通じて営業部門にお問い合わせください。

使用量層1分あたりのリクエスト数(RPM)
1100
22,000
34,000
48,000

トークンカウントとメッセージ作成は別個の独立したレート制限を持っています - 一方の使用量は他方の制限にはカウントされません。