Claude Sonnet 3.7 能夠以 token 高效的方式調用工具。請求平均可節省 14% 的輸出 token,最高可達 70%,這也減少了延遲。確切的 token 減少量和延遲改善取決於整體回應的形狀和大小。

高效使用工具的 token 優化是一項測試版功能。在生產環境中使用前,請確保評估您的回應。

請使用此表單提供關於模型回應質量、API 本身或文檔質量的反饋——我們迫不及待想聽取您的意見!

如果您選擇嘗試此功能,我們建議使用Console中的提示改進器來改進您的提示。

高效使用工具的 token 優化目前不適用於disable_parallel_tool_use

Claude 4 模型(Opus 和 Sonnet)不支持此功能。測試版標頭 token-efficient-tools-2025-02-19 不會破壞 API 請求,但它將不會產生任何效果。

要使用此測試版功能,只需在工具使用請求中添加測試版標頭 token-efficient-tools-2025-02-19。如果您使用 SDK,請確保您使用的是帶有 anthropic.beta.messages 的測試版 SDK。

以下是如何使用 API 進行高效工具使用的示例:

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: token-efficient-tools-2025-02-19" \
  -d '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "tools": [
      {
        "name": "get_weather",
        "description": "Get the current weather in a given location",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "The city and state, e.g. San Francisco, CA"
            }
          },
          "required": [
            "location"
          ]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Tell me the weather in San Francisco."
      }
    ]
  }' | jq '.usage'

上述請求應該平均使用比正常請求更少的輸入和輸出 token。要確認這一點,請嘗試發出相同的請求,但從測試版標頭列表中移除 token-efficient-tools-2025-02-19

為了保持提示快取的好處,請為您想要快取的請求一致地使用測試版標頭。如果您選擇性地使用它,提示快取將會失敗。