有效管理成本
了解如何在使用 Claude Code 时跟踪和优化令牌使用量和成本。
Claude Code 每次交互都会消耗令牌。平均成本为每位开发者每天 12 以下。
对于团队使用,Claude Code 按 API 令牌消耗量收费。平均而言,使用 Sonnet 4 的 Claude Code 每位开发者每月成本约为 $100-200,但根据用户运行的实例数量以及是否在自动化中使用,存在很大差异。
跟踪您的成本
- 使用
/cost
查看当前会话使用量 - Anthropic Console 用户:
- Pro 和 Max 计划用户:使用量包含在您的订阅中
为团队管理成本
使用 Anthropic API 时,您可以限制 Claude Code 工作区的总支出。要配置,请按照这些说明操作。管理员可以通过按照这些说明操作查看成本和使用量报告。
在 Bedrock 和 Vertex 上,Claude Code 不会从您的云端发送指标。为了获取成本指标,几家大型企业报告使用了 LiteLLM,这是一个开源工具,帮助公司按密钥跟踪支出。该项目与 Anthropic 无关,我们未审核其安全性。
速率限制建议
为团队设置 Claude Code 时,请根据您的组织规模考虑以下每用户令牌每分钟 (TPM) 和请求每分钟 (RPM) 建议:
团队规模 | 每用户 TPM | 每用户 RPM |
---|---|---|
1-5 用户 | 200k-300k | 5-7 |
5-20 用户 | 100k-150k | 2.5-3.5 |
20-50 用户 | 50k-75k | 1.25-1.75 |
50-100 用户 | 25k-35k | 0.62-0.87 |
100-500 用户 | 15k-20k | 0.37-0.47 |
500+ 用户 | 10k-15k | 0.25-0.35 |
例如,如果您有 200 个用户,您可能为每个用户请求 20k TPM,或总共 400 万 TPM(200*20,000 = 400 万)。
随着团队规模的增长,每用户 TPM 会减少,因为我们预期在较大的组织中同时使用 Claude Code 的用户会更少。这些速率限制适用于组织级别,而不是每个单独用户,这意味着当其他人没有积极使用服务时,单个用户可以暂时消耗超过其计算份额。
如果您预期会出现异常高并发使用的场景(例如大型团体的现场培训会话),您可能需要为每个用户分配更高的 TPM。
减少令牌使用量
-
紧凑对话:
-
Claude 默认在上下文超过 95% 容量时使用自动紧凑
-
切换自动紧凑:运行
/config
并导航到”Auto-compact enabled” -
当上下文变大时手动使用
/compact
-
添加自定义指令:
/compact Focus on code samples and API usage
-
通过添加到 CLAUDE.md 来自定义紧凑:
-
-
编写具体查询: 避免触发不必要扫描的模糊请求
-
分解复杂任务: 将大型任务拆分为专注的交互
-
在任务之间清除历史: 使用
/clear
重置上下文
成本可能因以下因素而显著变化:
- 被分析代码库的大小
- 查询的复杂性
- 被搜索或修改的文件数量
- 对话历史的长度
- 紧凑对话的频率
- 后台进程(俳句生成、对话摘要)
后台令牌使用量
Claude Code 即使在空闲时也会为某些后台功能使用令牌:
- 俳句生成:您输入时出现的小创意消息(大约每天 1 分钱)
- 对话摘要:为
claude --resume
功能摘要先前对话的后台作业 - 命令处理:某些命令如
/cost
可能生成请求来检查状态
这些后台进程即使没有主动交互也会消耗少量令牌(通常每个会话不到 $0.04)。
对于团队部署,我们建议从小型试点组开始建立使用模式,然后再进行更广泛的推广。