Claude Sonnet 3.7はトークン効率の良い方法でツールを呼び出すことができます。リクエストは平均で出力トークンの14%、最大で70%を節約でき、レイテンシーも削減されます。正確なトークン削減とレイテンシー改善は、全体的な応答の形状とサイズによって異なります。

トークン効率の良いツール使用はベータ機能です。本番環境で使用する前に、必ず応答を評価してください。

このフォームを使用して、モデル応答の品質、API自体、またはドキュメントの品質についてフィードバックを提供してください。皆様からのご意見をお待ちしています!

この機能を試す場合は、Consoleプロンプト改善ツールを使用してプロンプトを改善することをお勧めします。

トークン効率の良いツール使用は現在、disable_parallel_tool_useと連携していません。

Claude 4モデル(OpusとSonnet)はこの機能をサポートしていません。ベータヘッダーtoken-efficient-tools-2025-02-19はAPIリクエストを壊すことはありませんが、何も効果がありません。

このベータ機能を使用するには、ツール使用リクエストにベータヘッダーtoken-efficient-tools-2025-02-19を追加するだけです。SDKを使用している場合は、anthropic.beta.messagesを使用したベータSDKを使用していることを確認してください。

APIでトークン効率の良いツールを使用する例を以下に示します:

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: token-efficient-tools-2025-02-19" \
  -d '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "tools": [
      {
        "name": "get_weather",
        "description": "Get the current weather in a given location",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "The city and state, e.g. San Francisco, CA"
            }
          },
          "required": [
            "location"
          ]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Tell me the weather in San Francisco."
      }
    ]
  }' | jq '.usage'

上記のリクエストは、通常のリクエストよりも平均して少ない入力および出力トークンを使用するはずです。これを確認するには、ベータヘッダーのリストからtoken-efficient-tools-2025-02-19を削除して同じリクエストを行ってみてください。

プロンプトキャッシングの利点を維持するには、キャッシュしたいリクエストに対してベータヘッダーを一貫して使用してください。選択的に使用すると、プロンプトキャッシングは失敗します。