Claude Sonnet 3.7 mampu memanggil alat dengan cara yang efisien token. Permintaan menghemat rata-rata 14% token output, hingga 70%, yang juga mengurangi latensi. Pengurangan token yang tepat dan peningkatan latensi bergantung pada bentuk dan ukuran respons secara keseluruhan.

Penggunaan alat yang efisien token adalah fitur beta. Pastikan untuk mengevaluasi respons Anda sebelum menggunakannya dalam produksi.

Silakan gunakan formulir ini untuk memberikan umpan balik tentang kualitas respons model, API itu sendiri, atau kualitas dokumentasi—kami tidak sabar untuk mendengar dari Anda!

Jika Anda memilih untuk bereksperimen dengan fitur ini, kami sarankan menggunakan Prompt Improver di Console untuk meningkatkan prompt Anda.

Penggunaan alat yang efisien token saat ini tidak berfungsi dengan disable_parallel_tool_use.

Model Claude 4 (Opus dan Sonnet) tidak mendukung fitur ini. Header beta token-efficient-tools-2025-02-19 tidak akan merusak permintaan API, tetapi akan menghasilkan no-op.

Untuk menggunakan fitur beta ini, cukup tambahkan header beta token-efficient-tools-2025-02-19 ke permintaan penggunaan alat. Jika Anda menggunakan SDK, pastikan Anda menggunakan SDK beta dengan anthropic.beta.messages.

Berikut contoh cara menggunakan alat yang efisien token dengan API:

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: token-efficient-tools-2025-02-19" \
  -d '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "tools": [
      {
        "name": "get_weather",
        "description": "Get the current weather in a given location",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "The city and state, e.g. San Francisco, CA"
            }
          },
          "required": [
            "location"
          ]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Tell me the weather in San Francisco."
      }
    ]
  }' | jq '.usage'

Permintaan di atas seharusnya, rata-rata, menggunakan lebih sedikit token input dan output daripada permintaan normal. Untuk mengonfirmasi ini, coba buat permintaan yang sama tetapi hapus token-efficient-tools-2025-02-19 dari daftar header beta.

Untuk mempertahankan manfaat caching prompt, gunakan header beta secara konsisten untuk permintaan yang ingin Anda cache. Jika Anda menggunakannya secara selektif, caching prompt akan gagal.