Comprendre les fenêtres de contexte de Claude et comment elles fonctionnent avec la pensée étendue et l’utilisation d’outils.
max_tokens
, sont facturés comme jetons de sortie, et comptent vers les limites de taux.
Cependant, les blocs de pensée précédents sont automatiquement supprimés du calcul de la fenêtre de contexte par l’API Anthropic et ne font pas partie de l’historique de conversation que le modèle “voit” pour les tours suivants, préservant la capacité de jetons pour le contenu de conversation réel.
Le diagramme ci-dessous démontre la gestion spécialisée des jetons lorsque la pensée étendue est activée :
context_window = (input_tokens - previous_thinking_tokens) + current_turn_tokens
.thinking
et redacted_thinking
.Architecture du premier tour
Gestion du résultat d'outil (tour 2)
tool_result
. Le bloc de pensée étendue doit être retourné avec les résultats d’outils correspondants. C’est le seul cas où vous devez retourner les blocs de pensée.user
).Troisième étape
User
.User
en dehors du cycle d’utilisation d’outil, Claude générera un nouveau bloc de pensée étendue et continuera à partir de là.Assistant
actuel compte comme partie de la fenêtre de contexte.context_window = input_tokens + current_turn_tokens
.tool_result
entre les deux.Pour plus d’informations sur l’utilisation d’outils avec la pensée étendue, voir notre guide de pensée étendue.context-1m-2025-08-07
dans vos requêtes API :