Claude Sonnet 3.7 es capaz de llamar a herramientas de manera eficiente en cuanto a tokens. Las solicitudes ahorran un promedio del 14% en tokens de salida, hasta un 70%, lo que también reduce la latencia. La reducción exacta de tokens y las mejoras de latencia dependen de la forma y el tamaño general de la respuesta.

El uso de herramientas con eficiencia de tokens es una característica beta. Asegúrese de evaluar sus respuestas antes de usarla en producción.

Utilice este formulario para proporcionar comentarios sobre la calidad de las respuestas del modelo, la API en sí o la calidad de la documentación. ¡Estamos ansiosos por escuchar sus opiniones!

Si decide experimentar con esta característica, recomendamos usar el Mejorador de Prompts en la Consola para mejorar su prompt.

El uso de herramientas con eficiencia de tokens actualmente no funciona con disable_parallel_tool_use.

Los modelos Claude 4 (Opus y Sonnet) no admiten esta característica. El encabezado beta token-efficient-tools-2025-02-19 no interrumpirá una solicitud de API, pero resultará en una operación nula.

Para usar esta característica beta, simplemente agregue el encabezado beta token-efficient-tools-2025-02-19 a una solicitud de uso de herramientas. Si está utilizando el SDK, asegúrese de estar utilizando el SDK beta con anthropic.beta.messages.

Aquí hay un ejemplo de cómo usar herramientas eficientes en tokens con la API:

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: token-efficient-tools-2025-02-19" \
  -d '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "tools": [
      {
        "name": "get_weather",
        "description": "Get the current weather in a given location",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "The city and state, e.g. San Francisco, CA"
            }
          },
          "required": [
            "location"
          ]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Tell me the weather in San Francisco."
      }
    ]
  }' | jq '.usage'

La solicitud anterior debería, en promedio, usar menos tokens de entrada y salida que una solicitud normal. Para confirmar esto, intente hacer la misma solicitud pero elimine token-efficient-tools-2025-02-19 de la lista de encabezados beta.

Para mantener los beneficios del almacenamiento en caché de prompts, use el encabezado beta de manera consistente para las solicitudes que desee almacenar en caché. Si lo usa selectivamente, el almacenamiento en caché de prompts fallará.