工具
代幣高效工具使用
了解如何使用 Claude Sonnet 3.7 的代幣高效工具使用功能來節省代幣並減少延遲。
Claude Sonnet 3.7 能夠以代幣高效的方式調用工具。請求平均節省 14% 的輸出代幣,最高可達 70%,這也減少了延遲。確切的代幣減少和延遲改善取決於整體回應的形狀和大小。
代幣高效工具使用是一個測試版功能。請確保在生產環境中使用之前評估您的回應。
請使用此表單提供關於模型回應品質、API 本身或文檔品質的回饋意見——我們迫不及待想聽到您的意見!
代幣高效工具使用目前不支援disable_parallel_tool_use
。
Claude 4 模型(Opus 4.1、Opus 4 和 Sonnet 4)不支援此功能。測試版標頭 token-efficient-tools-2025-02-19
不會中斷 API 請求,但會導致無操作。
要使用此測試版功能,只需將測試版標頭 token-efficient-tools-2025-02-19
添加到工具使用請求中。如果您使用 SDK,請確保您使用的是帶有 anthropic.beta.messages
的測試版 SDK。
以下是如何使用 API 進行代幣高效工具使用的範例:
上述請求平均應該比正常請求使用更少的輸入和輸出代幣。要確認這一點,請嘗試發出相同的請求,但從測試版標頭列表中移除 token-efficient-tools-2025-02-19
。
為了保持提示快取的好處,請對您想要快取的請求一致地使用測試版標頭。如果您選擇性地使用它,提示快取將會失敗。