扩展思考模式
所有在Claude Sonnet 3.7之后发布的Opus和Sonnet模型都支持标准和扩展思考模式。在标准模式下,这些模型的运行方式与之前的Claude模型类似。在扩展思考模式下,Claude会在输出最终回答之前展示其思考过程,让您了解其推理过程。
扩展思考概述
扩展思考模型有两种运行模式:
- 标准模式:类似于之前的Claude模型,提供直接的回答而不显示内部推理过程
- 扩展思考模式:在提供最终答案之前展示Claude的推理过程
何时使用标准模式
标准模式适用于大多数常规用例,包括:
- 一般内容生成
- 基本编程辅助
- 常规代理任务
- 计算机使用指导
- 大多数对话应用
何时使用扩展思考模式
扩展思考模式在以下关键领域表现出色:
- 复杂分析:涉及多个参数和因素的金融、法律或数据分析
- 高级STEM问题:数学、物理、研究与开发
- 长上下文处理:处理和综合来自大量输入的信息
- 约束优化:具有多个相互竞争需求的问题
- 详细数据生成:创建全面的表格或结构化信息集
- 复杂指令遵循:具有复杂系统提示和需要考虑多种因素的聊天机器人
- 结构化创意任务:需要详细规划、大纲或管理多个叙事元素的创意写作
要了解更多关于扩展思考的工作原理,请参阅扩展思考。
开始使用扩展思考模型
如果您是首次尝试扩展思考,以下是一些建议:
- 从标准模式开始:首先在不使用扩展思考的情况下使用您选择的Opus或Sonnet模型,以建立基准性能
- 识别改进机会:尝试以低预算开启扩展思考模式,看看您的用例是否会从更深入的推理中受益。可能您的用例更适合在标准模式下使用更详细的提示,而不是Claude的扩展思考。
- 逐步实施:如有需要,在测试性能是否符合您的要求的同时,逐步增加思考预算。
- 优化令牌使用:一旦达到可接受的性能,设置适当的令牌限制以管理成本。
- 探索新可能性:我们最新的Opus和Sonnet模型,无论是否使用扩展思考,在各种领域都比之前的Claude模型更强大。我们鼓励您在之前使用其他模型遇到限制的用例中尝试这些模型。
使用扩展思考模型进行构建
一般模型信息
有关所有当前支持扩展思考的Claude模型的定价、上下文窗口大小和其他信息,请参阅所有模型概述。
使用扩展思考模型时的最大令牌数和上下文窗口变化
在较旧的Claude模型(扩展思考模型之前)中,如果提示令牌和max_tokens
的总和超过了模型的上下文窗口,系统会自动调整max_tokens
以适应上下文限制。这意味着您可以设置一个较大的max_tokens
值,系统会静默地根据需要减少它。
对于扩展思考模型,max_tokens
(在启用思考时包括您的思考预算)被强制执行为严格限制。如果提示令牌 + max_tokens
超过上下文窗口大小,系统现在会返回验证错误。
从旧模型迁移到扩展思考模型
如果您正在从另一个模型转移提示,无论是另一个Claude模型还是来自另一个模型提供商,以下是一些建议:
标准模式迁移
- 简化您的提示:扩展思考模型需要更少的引导。移除您在之前版本中使用的任何特定于模型的指导语言,例如关于处理冗长性的语言 - 这类语言可能是不必要的,移除它们将节省令牌并降低成本。
否则,如果您在关闭扩展思考的情况下使用这些模型,通常不需要更改提示。如果遇到问题,请应用一般的提示工程最佳实践。
扩展思考模式迁移
使用扩展思考时,首先从您的提示中移除所有思维链(CoT)指导。扩展思考模型设计为无需明确的推理指令即可有效工作。
- 与其规定思考模式,不如先观察Claude的自然思考过程,然后根据您所看到的调整提示。
- 如果您想提供思考指导,可以在提示中以自然语言包含指导,Claude将能够将这些指令泛化到自己的思考中。
- 有关如何为扩展思考提示的更多技巧,请参阅扩展思考技巧。
从其他模型提供商迁移
Claude的扩展思考模型可能对为其他提供商的模型优化的提示模式有不同的响应。我们建议专注于清晰、直接的指令,而不是提供商特定的提示技术。移除为特定模型提供商量身定制的指令可能会带来更好的性能,因为Claude通常在开箱即用的情况下就能很好地遵循复杂指令。
您可以使用我们在console.anthropic.com上优化的提示改进器来帮助迁移提示。