トークン効率の良いツール使用(ベータ版)
Claude Sonnet 3.7はトークン効率の良い方法でツールを呼び出すことができます。リクエストは平均で出力トークンの14%、最大で70%を節約でき、レイテンシーも削減されます。正確なトークン削減とレイテンシー改善は、全体的な応答の形状とサイズによって異なります。
トークン効率の良いツール使用はベータ機能です。本番環境で使用する前に、必ず応答を評価してください。
このフォームを使用して、モデル応答の品質、API自体、またはドキュメントの品質についてフィードバックを提供してください。皆様からのご意見をお待ちしています!
この機能を試す場合は、Consoleのプロンプト改善ツールを使用してプロンプトを改善することをお勧めします。
トークン効率の良いツール使用は現在、disable_parallel_tool_use
と連携していません。
Claude 4モデル(OpusとSonnet)はこの機能をサポートしていません。ベータヘッダーtoken-efficient-tools-2025-02-19
はAPIリクエストを壊すことはありませんが、何も効果がありません。
このベータ機能を使用するには、ツール使用リクエストにベータヘッダーtoken-efficient-tools-2025-02-19
を追加するだけです。SDKを使用している場合は、anthropic.beta.messages
を使用したベータSDKを使用していることを確認してください。
APIでトークン効率の良いツールを使用する例を以下に示します:
上記のリクエストは、通常のリクエストよりも平均して少ない入力および出力トークンを使用するはずです。これを確認するには、ベータヘッダーのリストからtoken-efficient-tools-2025-02-19
を削除して同じリクエストを行ってみてください。
プロンプトキャッシングの利点を維持するには、キャッシュしたいリクエストに対してベータヘッダーを一貫して使用してください。選択的に使用すると、プロンプトキャッシングは失敗します。