Memahami jendela konteks dan cara kerjanya dengan pemikiran yang diperluas dan penggunaan alat.
max_tokens
Anda, ditagih sebagai token output, dan dihitung terhadap batas tingkat.
Namun, blok pemikiran sebelumnya secara otomatis dihapus dari perhitungan jendela konteks oleh API Anthropic dan bukan bagian dari riwayat percakapan yang “dilihat” model untuk giliran selanjutnya, mempertahankan kapasitas token untuk konten percakapan yang sebenarnya.
Diagram di bawah ini mendemonstrasikan manajemen token khusus saat pemikiran yang diperluas diaktifkan:
context_window = (input_tokens - previous_thinking_tokens) + current_turn_tokens
.thinking
dan blok redacted_thinking
.Arsitektur giliran pertama
Penanganan hasil alat (giliran 2)
tool_result
. Blok pemikiran yang diperluas harus dikembalikan dengan hasil alat yang sesuai. Ini adalah satu-satunya kasus di mana Anda harus mengembalikan blok pemikiran.user
berikutnya).Langkah Ketiga
User
berikutnya.User
baru di luar siklus penggunaan alat, Claude akan menghasilkan blok pemikiran yang diperluas baru dan melanjutkan dari sana.Assistant
saat ini dihitung sebagai bagian dari jendela konteks.context_window = input_tokens + current_turn_tokens
.tool_result
di antaranya.Untuk informasi lebih lanjut tentang menggunakan alat dengan pemikiran yang diperluas, lihat panduan pemikiran yang diperluas kami.context-1m-2025-08-07
dalam permintaan API Anda: