本页面提供了 Anthropic 模型和功能的详细定价信息。所有价格均以美元计价。

有关最新定价信息,请访问 anthropic.com/pricing

模型定价

下表显示了所有 Claude 模型在不同使用层级的定价:

ModelBase Input TokensCache WritesCache HitsOutput Tokens
Claude 3.7 Sonnet$3 / MTok$3.75 / MTok$0.30 / MTok$15 / MTok
Claude 3.5 Sonnet$3 / MTok$3.75 / MTok$0.30 / MTok$15 / MTok
Claude 3.5 Haiku$0.80 / MTok$1 / MTok$0.08 / MTok$4 / MTok
Claude 3 Opus$15 / MTok$18.75 / MTok$1.50 / MTok$75 / MTok
Claude 3 Haiku$0.25 / MTok$0.30 / MTok$0.03 / MTok$1.25 / MTok

MTok = 百万令牌。“基础输入令牌”列显示标准输入定价,“缓存写入”和”缓存命中”是针对提示缓存的特定功能,“输出令牌”显示输出定价。

特定功能定价

批处理

批处理 API 允许异步处理大量请求,输入和输出令牌均可享受 50% 的折扣。

ModelBatch inputBatch output
Claude 3.7 Sonnet$1.50 / MTok$7.50 / MTok
Claude 3.5 Sonnet$1.50 / MTok$7.50 / MTok
Claude 3.5 Haiku$0.40 / MTok$2 / MTok
Claude 3 Opus$7.50 / MTok$37.50 / MTok
Claude 3 Haiku$0.125 / MTok$0.625 / MTok

有关批处理的更多信息,请参阅我们的批处理文档

工具使用定价

Tool use requests are priced based on:

  1. The total number of input tokens sent to the model (including in the tools parameter)
  2. The number of output tokens generated
  3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

The additional tokens from tool use come from:

  • The tools parameter in API requests (tool names, descriptions, and schemas)
  • tool_use content blocks in API requests and responses
  • tool_result content blocks in API requests

When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

ModelTool choiceTool use system prompt token count
Claude 3.7 Sonnetauto, none
any, tool
346 tokens
313 tokens
Claude 3.5 Sonnet (Oct)auto, none
any, tool
346 tokens
313 tokens
Claude 3 Opusauto, none
any, tool
530 tokens
281 tokens
Claude 3 Sonnetauto, none
any, tool
159 tokens
235 tokens
Claude 3 Haikuauto, none
any, tool
264 tokens
340 tokens
Claude 3.5 Sonnet (June)auto, none
any, tool
294 tokens
261 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request.

有关当前每个模型的价格,请参考上面的模型定价部分。

有关工具使用实施和最佳实践的更多信息,请参阅我们的工具使用文档

代理用例定价示例

在使用 Claude 构建应用时,了解代理应用的定价至关重要。这些真实示例可以帮助您估算不同代理模式的成本。

客户支持代理示例

在构建客户支持代理时,成本可能会这样分解:

处理 10,000 个支持工单的示例计算:

  • 每次对话平均约 3,700 个令牌
  • 使用 Claude 3.7 Sonnet,输入 3/MTok,输出3/MTok,输出 15/MTok
  • 总成本:每 10,000 个工单约 $22.20

有关此计算的详细说明,请参阅我们的客户支持代理指南

通用代理工作流定价

对于具有多个步骤的更复杂代理架构:

  1. 初始请求处理

    • 典型输入:500-1,000 个令牌
    • 处理成本:每个请求约 $0.003
  2. 记忆和上下文检索

    • 检索的上下文:2,000-5,000 个令牌
    • 每次检索成本:每次操作约 $0.015
  3. 行动规划和执行

    • 规划令牌:1,000-2,000
    • 执行反馈:500-1,000
    • 综合成本:每个动作约 $0.045

有关代理定价模式的完整指南,请参阅我们的代理用例指南

成本优化策略

在使用 Claude 构建代理时:

  1. 使用适当的模型:简单任务选择 Haiku,复杂推理选择 Sonnet
  2. 实施提示缓存:减少重复上下文的成本
  3. 批量操作:对非时间敏感的任务使用批处理 API
  4. 监控使用模式:跟踪令牌消耗以识别优化机会

对于高容量代理应用,请考虑联系我们的企业销售团队以获取定制定价安排。

其他定价考虑因素

速率限制

速率限制因使用层级而异,影响您可以发出的请求数量:

  • 第 1 层:基础使用级别,具有基本限制
  • 第 2 层:增加了成长型应用的限制
  • 第 3 层:成熟应用的更高限制
  • 第 4 层:最高标准限制
  • 企业版:可提供自定义限制

有关详细的速率限制信息,请参阅我们的速率限制文档

批量折扣

高容量用户可能享有批量折扣。这些折扣是根据具体情况协商的。

  • 标准层级使用上述定价
  • 企业客户可以联系销售获取定制定价
  • 可能提供学术和研究折扣

企业定价

针对具有特定需求的企业客户:

  • 自定义速率限制
  • 批量折扣
  • 专门支持
  • 自定义条款

通过 sales@anthropic.comAnthropic Console 联系我们的销售团队,讨论企业定价选项。

账单和支付

  • 每月根据实际使用情况计算账单
  • 以美元处理付款
  • 提供信用卡和发票选项
  • 可在 Anthropic Console 中跟踪使用情况

常见问题

如何计算令牌使用量?

令牌是模型处理的文本片段。粗略估计,在英语中 1 个令牌约等于 4 个字符或 0.75 个单词。具体数量因语言和内容类型而异。

是否有免费层级或试用版?

新用户可获得少量免费积分来测试 API。联系销售了解企业评估的延长试用信息。

折扣如何叠加?

批处理 API 和提示缓存折扣可以组合。例如,同时使用这两个功能与标准 API 调用相比可以节省大量成本。

接受哪些支付方式?

我们接受标准账户的主要信用卡。企业客户可以安排发票和其他支付方式。

如有关于定价的其他问题,请联系 support@anthropic.com