Model Claude 3.7 Sonnet yang telah ditingkatkan mampu memanggil alat dengan cara yang hemat token. Permintaan menghemat rata-rata 14% token keluaran, hingga 70%, yang juga mengurangi latensi. Pengurangan token yang tepat dan peningkatan latensi tergantung pada bentuk dan ukuran respons secara keseluruhan.

Penggunaan alat hemat token adalah fitur beta. Pastikan untuk mengevaluasi respons Anda sebelum menggunakannya dalam produksi.

Silakan gunakan formulir ini untuk memberikan umpan balik tentang kualitas respons model, API itu sendiri, atau kualitas dokumentasi—kami tidak sabar untuk mendengar dari Anda!

Jika Anda memilih untuk bereksperimen dengan fitur ini, kami menyarankan menggunakan Prompt Improver di Console untuk meningkatkan prompt Anda.

Penggunaan alat hemat token saat ini tidak berfungsi dengan disable_parallel_tool_use.

Untuk menggunakan fitur beta ini, cukup tambahkan header beta token-efficient-tools-2025-02-19 ke permintaan penggunaan alat dengan claude-3-7-sonnet-20250219. Jika Anda menggunakan SDK, pastikan bahwa Anda menggunakan SDK beta dengan anthropic.beta.messages.

Berikut contoh cara menggunakan alat hemat token dengan API:

Permintaan di atas seharusnya, rata-rata, menggunakan lebih sedikit token input dan output dibandingkan permintaan normal. Untuk mengkonfirmasi ini, cobalah membuat permintaan yang sama tetapi hapus token-efficient-tools-2025-02-19 dari daftar header beta.

Untuk mempertahankan manfaat caching prompt, gunakan header beta secara konsisten untuk permintaan yang ingin Anda cache. Jika Anda menggunakannya secara selektif, caching prompt akan gagal.

Was this page helpful?