扩展思考模式

所有在Claude Sonnet 3.7之后发布的Opus和Sonnet模型都支持标准和扩展思考模式。在标准模式下，这些模型的运行方式与之前的Claude模型类似。在扩展思考模式下，Claude会在输出最终回答之前展示其思考过程，让您了解其推理过程。

扩展思考概述

扩展思考模型有两种运行模式：

标准模式：类似于之前的Claude模型，提供直接的回答而不显示内部推理过程
扩展思考模式：在提供最终答案之前展示Claude的推理过程

何时使用标准模式

标准模式适用于大多数常规用例，包括：

一般内容生成
基本编程辅助
常规代理任务
计算机使用指导
大多数对话应用

何时使用扩展思考模式

扩展思考模式在以下关键领域表现出色：

复杂分析：涉及多个参数和因素的金融、法律或数据分析
高级STEM问题：数学、物理、研究与开发
长上下文处理：处理和综合来自大量输入的信息
约束优化：具有多个相互竞争需求的问题
详细数据生成：创建全面的表格或结构化信息集
复杂指令遵循：具有复杂系统提示和需要考虑多种因素的聊天机器人
结构化创意任务：需要详细规划、大纲或管理多个叙事元素的创意写作

要了解更多关于扩展思考的工作原理，请参阅扩展思考。

开始使用扩展思考模型

如果您是首次尝试扩展思考，以下是一些建议：

从标准模式开始：首先在不使用扩展思考的情况下使用您选择的Opus或Sonnet模型，以建立基准性能
识别改进机会：尝试以低预算开启扩展思考模式，看看您的用例是否会从更深入的推理中受益。可能您的用例更适合在标准模式下使用更详细的提示，而不是Claude的扩展思考。
逐步实施：如有需要，在测试性能是否符合您的要求的同时，逐步增加思考预算。
优化令牌使用：一旦达到可接受的性能，设置适当的令牌限制以管理成本。
探索新可能性：我们最新的Opus和Sonnet模型，无论是否使用扩展思考，在各种领域都比之前的Claude模型更强大。我们鼓励您在之前使用其他模型遇到限制的用例中尝试这些模型。

使用扩展思考模型进行构建

一般模型信息

有关所有当前支持扩展思考的Claude模型的定价、上下文窗口大小和其他信息，请参阅所有模型概述。

使用扩展思考模型时的最大令牌数和上下文窗口变化

在较旧的Claude模型（扩展思考模型之前）中，如果提示令牌和max_tokens的总和超过了模型的上下文窗口，系统会自动调整max_tokens以适应上下文限制。这意味着您可以设置一个较大的max_tokens值，系统会静默地根据需要减少它。对于扩展思考模型，max_tokens（在启用思考时包括您的思考预算）被强制执行为严格限制。如果提示令牌 + max_tokens超过上下文窗口大小，系统现在会返回验证错误。

从旧模型迁移到扩展思考模型

如果您正在从另一个模型转移提示，无论是另一个Claude模型还是来自另一个模型提供商，以下是一些建议：

标准模式迁移

简化您的提示：扩展思考模型需要更少的引导。移除您在之前版本中使用的任何特定于模型的指导语言，例如关于处理冗长性的语言 - 这类语言可能是不必要的，移除它们将节省令牌并降低成本。

否则，如果您在关闭扩展思考的情况下使用这些模型，通常不需要更改提示。如果遇到问题，请应用一般的提示工程最佳实践。