了解 Claude 的上下文視窗如何運作,包括延伸思考、工具使用和 1M 代幣上下文視窗。
max_tokens
參數的子集,按輸出代幣計費,並計入速率限制。
然而,先前的思考區塊會被 Anthropic API 自動從上下文視窗計算中剝離,不是模型在後續回合中「看到」的對話歷史的一部分,為實際對話內容保留代幣容量。
下圖展示了啟用延伸思考時的專門代幣管理:
context_window = (input_tokens - previous_thinking_tokens) + current_turn_tokens
。thinking
區塊和 redacted_thinking
區塊。第一回合架構
工具結果處理(第二回合)
tool_result
。延伸思考區塊必須與相應的工具結果一起返回。這是您必須返回思考區塊的唯一情況。user
訊息之前不會有額外的延伸思考)。第三步
User
回合的地方。User
回合,Claude 將生成新的延伸思考區塊並從那裡繼續。Assistant
回合中的思考區塊計為上下文視窗的一部分。context_window = input_tokens + current_turn_tokens
。context-1m-2025-08-07
測試標頭: