扩展思维模式
Claude 3.7 Sonnet 是一个能够同时进行标准思维和扩展思维模式的混合模型。在标准模式下,Claude 3.7 Sonnet 的运行方式与 Claude 3 系列的其他模型类似。在扩展思维模式下,Claude 会在输出响应之前输出其思维过程,让您能够洞察其推理过程。
Claude 3.7 概述
Claude 3.7 Sonnet 以两种模式运行:
- 标准模式:类似于之前的 Claude 模型,提供直接响应而不显示内部推理
- 扩展思维模式:在提供最终答案之前展示 Claude 的推理过程
何时使用标准模式
标准模式适用于大多数常规用例,包括:
- 常规内容生成
- 基础编码辅助
- 日常代理任务
- 计算机使用指导
- 大多数对话应用
何时使用扩展思维模式
扩展思维模式在以下关键领域表现出色:
- 复杂分析:涉及多个参数和因素的金融、法律或数据分析
- 高级 STEM 问题:数学、物理、研究与开发
- 长文本处理:处理和综合大量输入信息
- 约束优化:具有多个相互竞争要求的问题
- 详细数据生成:创建全面的表格或结构化信息集
- 复杂指令执行:具有复杂系统提示和需要考虑多个因素的聊天机器人
- 结构化创意任务:需要详细规划、大纲或管理多个叙事元素的创意写作
要了解更多关于扩展思维的工作原理,请参阅扩展思维。
Claude 3.7 Sonnet 入门
如果您是首次尝试 Claude 3.7 Sonnet,以下是一些建议:
- 从标准模式开始:首先在不使用扩展思维的情况下使用 Claude 3.7 Sonnet,以建立基准性能
- 识别改进机会:尝试以低预算开启扩展思维模式,看看您的用例是否会从更深入的推理中受益。可能您的用例更适合在标准模式下使用更详细的提示,而不是使用 Claude 的扩展思维。
- 逐步实施:如有需要,在测试性能是否符合您的要求的同时,逐步增加思维预算。
- 优化令牌使用:一旦达到可接受的性能,设置适当的令牌限制以管理成本。
- 探索新可能性:无论是否使用扩展思维,Claude 3.7 Sonnet 在各种领域都比之前的 Claude 模型更强大。我们鼓励您在之前使用其他模型遇到限制的用例中尝试使用 Claude 3.7 Sonnet。
基于 Claude 3.7 Sonnet 构建
一般模型信息
有关 Claude 3.7 Sonnet 和所有其他当前 Claude 模型的定价、上下文窗口大小和其他信息,请参阅所有模型概述。
Claude 3.7 Sonnet 的最大令牌数和上下文窗口变化
在较旧的 Claude 模型(在 Claude 3.7 Sonnet 之前),如果提示令牌和 max_tokens
的总和超过了模型的上下文窗口,系统会自动调整 max_tokens
以适应上下文限制。这意味着您可以设置一个较大的 max_tokens
值,系统会根据需要自动降低它。
在 Claude 3.7 Sonnet 中,max_tokens
(在启用思维时包括您的思维预算)被强制执行为严格限制。如果提示令牌 + max_tokens
超过上下文窗口大小,系统现在会返回验证错误。
扩展输出功能(测试版)
Claude 3.7 Sonnet 还可以生成比之前模型更长的响应,支持高达 128K 输出令牌(测试版)——比其他 Claude 模型长 15 倍以上。这种扩展的功能特别适用于涉及复杂推理、丰富代码生成和全面内容创建的扩展思维用例。
可以通过传递 anthropic-beta
头部值 output-128k-2025-02-19
来启用此功能。
在使用扩展思维进行较长输出时,您可以分配更大的思维预算以支持更全面的推理,同时仍有充足的令牌用于最终响应。
从其他模型迁移到 Claude 3.7 Sonnet
如果您正在从另一个模型(无论是另一个 Claude 模型还是其他模型提供商)转移提示,以下是一些建议:
标准模式迁移
- 简化您的提示:Claude 3.7 Sonnet 需要更少的引导。删除您在之前版本中使用的任何特定于模型的指导语言,例如关于处理详细程度的语言 - 这些语言可能是不必要的,并且可以节省令牌和降低成本。
否则,如果您在关闭扩展思维的情况下使用 Claude 3.7 Sonnet,通常不需要更改提示。如果遇到问题,请应用一般的提示工程最佳实践。
扩展思维模式迁移
在使用扩展思维时,首先从您的提示中删除所有思维链(CoT)指导。Claude 3.7 Sonnet 的思维功能设计为无需明确的推理指令即可有效工作。
- 与其规定思维模式,不如先观察 Claude 的自然思维过程,然后根据您看到的内容调整提示。
- 如果您想提供思维指导,可以在提示中以自然语言包含指导,Claude 将能够将这些指令泛化到自己的思维中。
- 有关如何提示扩展思维的更多建议,请参阅扩展思维提示。
从其他模型提供商迁移
Claude 3.7 Sonnet 可能会对为其他提供商的模型优化的提示模式做出不同的响应。我们建议专注于清晰、直接的指令,而不是提供商特定的提示技术。删除为特定模型提供商量身定制的此类指令可能会带来更好的性能,因为 Claude 通常能够很好地处理复杂的指令。
您可以使用我们在 console.anthropic.com 上优化的提示改进器来帮助迁移提示。