工具
高效使用工具的 token 優化(測試版)
Claude Sonnet 3.7 能夠以 token 高效的方式調用工具。請求平均可節省 14% 的輸出 token,最高可達 70%,這也減少了延遲。確切的 token 減少量和延遲改善取決於整體回應的形狀和大小。
高效使用工具的 token 優化是一項測試版功能。在生產環境中使用前,請確保評估您的回應。
請使用此表單提供關於模型回應質量、API 本身或文檔質量的反饋——我們迫不及待想聽取您的意見!
高效使用工具的 token 優化目前不適用於disable_parallel_tool_use
。
Claude 4 模型(Opus 和 Sonnet)不支持此功能。測試版標頭 token-efficient-tools-2025-02-19
不會破壞 API 請求,但它將不會產生任何效果。
要使用此測試版功能,只需在工具使用請求中添加測試版標頭 token-efficient-tools-2025-02-19
。如果您使用 SDK,請確保您使用的是帶有 anthropic.beta.messages
的測試版 SDK。
以下是如何使用 API 進行高效工具使用的示例:
上述請求應該平均使用比正常請求更少的輸入和輸出 token。要確認這一點,請嘗試發出相同的請求,但從測試版標頭列表中移除 token-efficient-tools-2025-02-19
。
為了保持提示快取的好處,請為您想要快取的請求一致地使用測試版標頭。如果您選擇性地使用它,提示快取將會失敗。