高效使用工具的令牌优化（测试版）

Claude Sonnet 3.7 能够以令牌高效的方式调用工具。请求平均节省14%的输出令牌，最高可达70%，这也减少了延迟。确切的令牌减少和延迟改进取决于整体响应的形状和大小。

高效使用工具的令牌优化是一项测试版功能。在生产环境中使用之前，请确保评估您的响应。

请使用此表单提供关于模型响应质量、API本身或文档质量的反馈——我们迫不及待想听取您的意见！

如果您选择尝试此功能，我们建议使用控制台中的提示改进器来改进您的提示。

高效使用工具的令牌优化目前不适用于disable_parallel_tool_use。

Claude 4 模型（Opus 和 Sonnet）不支持此功能。测试版标头token-efficient-tools-2025-02-19不会破坏API请求，但它将不起作用。

要使用此测试版功能，只需在工具使用请求中添加测试版标头token-efficient-tools-2025-02-19。如果您使用的是SDK，请确保使用带有anthropic.beta.messages的测试版SDK。

以下是如何使用API进行高效工具令牌优化的示例：

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: token-efficient-tools-2025-02-19" \
  -d '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "tools": [
      {
        "name": "get_weather",
        "description": "Get the current weather in a given location",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "The city and state, e.g. San Francisco, CA"
            }
          },
          "required": [
            "location"
          ]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Tell me the weather in San Francisco."
      }
    ]
  }' | jq '.usage'

上述请求应该平均比普通请求使用更少的输入和输出令牌。要确认这一点，请尝试发出相同的请求，但从测试版标头列表中删除token-efficient-tools-2025-02-19。

为了保持提示缓存的好处，请为您想要缓存的请求一致地使用测试版标头。如果您选择性地使用它，提示缓存将失败。

如何实现工具使用细粒度工具流式传输

第一步

模型和定价

了解 Claude

功能

工具

模型上下文协议 (MCP)

使用场景

提示工程

测试与评估

加强防护机制

法律中心

高效使用工具的令牌优化（测试版）