Claude Code 每次交互都会消耗令牌。平均成本为每位开发者每天 6906,90% 的用户每日成本保持在 12 以下。

对于团队使用,Claude Code 按 API 令牌消耗量收费。平均而言,使用 Sonnet 4 的 Claude Code 每位开发者每月成本约为 $100-200,但根据用户运行的实例数量以及是否在自动化中使用,存在很大差异。

跟踪您的成本

  • 使用 /cost 查看当前会话使用量
  • Anthropic Console 用户
  • Pro 和 Max 计划用户:使用量包含在您的订阅中

为团队管理成本

使用 Anthropic API 时,您可以限制 Claude Code 工作区的总支出。要配置,请按照这些说明操作。管理员可以通过按照这些说明操作查看成本和使用量报告。

在 Bedrock 和 Vertex 上,Claude Code 不会从您的云端发送指标。为了获取成本指标,几家大型企业报告使用了 LiteLLM,这是一个开源工具,帮助公司按密钥跟踪支出。该项目与 Anthropic 无关,我们未审核其安全性。

速率限制建议

为团队设置 Claude Code 时,请根据您的组织规模考虑以下每用户令牌每分钟 (TPM) 和请求每分钟 (RPM) 建议:

团队规模每用户 TPM每用户 RPM
1-5 用户200k-300k5-7
5-20 用户100k-150k2.5-3.5
20-50 用户50k-75k1.25-1.75
50-100 用户25k-35k0.62-0.87
100-500 用户15k-20k0.37-0.47
500+ 用户10k-15k0.25-0.35

例如,如果您有 200 个用户,您可能为每个用户请求 20k TPM,或总共 400 万 TPM(200*20,000 = 400 万)。

随着团队规模的增长,每用户 TPM 会减少,因为我们预期在较大的组织中同时使用 Claude Code 的用户会更少。这些速率限制适用于组织级别,而不是每个单独用户,这意味着当其他人没有积极使用服务时,单个用户可以暂时消耗超过其计算份额。

如果您预期会出现异常高并发使用的场景(例如大型团体的现场培训会话),您可能需要为每个用户分配更高的 TPM。

减少令牌使用量

  • 紧凑对话:

    • Claude 默认在上下文超过 95% 容量时使用自动紧凑

    • 切换自动紧凑:运行 /config 并导航到”Auto-compact enabled”

    • 当上下文变大时手动使用 /compact

    • 添加自定义指令:/compact Focus on code samples and API usage

    • 通过添加到 CLAUDE.md 来自定义紧凑:

      # Summary instructions
      
      When you are using compact, please focus on test output and code changes
      
  • 编写具体查询: 避免触发不必要扫描的模糊请求

  • 分解复杂任务: 将大型任务拆分为专注的交互

  • 在任务之间清除历史: 使用 /clear 重置上下文

成本可能因以下因素而显著变化:

  • 被分析代码库的大小
  • 查询的复杂性
  • 被搜索或修改的文件数量
  • 对话历史的长度
  • 紧凑对话的频率
  • 后台进程(俳句生成、对话摘要)

后台令牌使用量

Claude Code 即使在空闲时也会为某些后台功能使用令牌:

  • 俳句生成:您输入时出现的小创意消息(大约每天 1 分钱)
  • 对话摘要:为 claude --resume 功能摘要先前对话的后台作业
  • 命令处理:某些命令如 /cost 可能生成请求来检查状态

这些后台进程即使没有主动交互也会消耗少量令牌(通常每个会话不到 $0.04)。

对于团队部署,我们建议从小型试点组开始建立使用模式,然后再进行更广泛的推广。