有效管理成本
了解如何在使用 Claude Code 時追蹤和優化代幣使用量和成本。
Claude Code 每次互動都會消耗代幣。平均成本為每位開發者每天 12 以下。
對於團隊使用,Claude Code 按 API 代幣消耗量收費。平均而言,使用 Sonnet 4 的 Claude Code 每位開發者每月成本約為 $100-200,但根據用戶運行的實例數量以及是否在自動化中使用,會有很大的差異。
追蹤您的成本
- 使用
/cost
查看當前會話使用量 - Anthropic Console 用戶:
- Pro 和 Max 方案用戶:使用量包含在您的訂閱中
為團隊管理成本
使用 Anthropic API 時,您可以限制 Claude Code 工作區的總支出。要配置,請按照這些說明操作。管理員可以通過按照這些說明操作查看成本和使用量報告。
在 Bedrock 和 Vertex 上,Claude Code 不會從您的雲端發送指標。為了獲取成本指標,幾家大型企業報告使用了 LiteLLM,這是一個開源工具,幫助公司按密鑰追蹤支出。此項目與 Anthropic 無關,我們尚未審核其安全性。
速率限制建議
為團隊設置 Claude Code 時,請根據您的組織規模考慮這些每用戶每分鐘代幣數(TPM)和每分鐘請求數(RPM)建議:
團隊規模 | 每用戶 TPM | 每用戶 RPM |
---|---|---|
1-5 用戶 | 200k-300k | 5-7 |
5-20 用戶 | 100k-150k | 2.5-3.5 |
20-50 用戶 | 50k-75k | 1.25-1.75 |
50-100 用戶 | 25k-35k | 0.62-0.87 |
100-500 用戶 | 15k-20k | 0.37-0.47 |
500+ 用戶 | 10k-15k | 0.25-0.35 |
例如,如果您有 200 個用戶,您可能會為每個用戶請求 20k TPM,或總共 400 萬 TPM(200*20,000 = 400 萬)。
隨著團隊規模的增長,每用戶 TPM 會減少,因為我們預期在較大的組織中同時使用 Claude Code 的用戶會更少。這些速率限制適用於組織級別,而不是每個個人用戶,這意味著當其他人沒有積極使用服務時,個人用戶可以暫時消耗超過其計算份額。
如果您預期會出現異常高並發使用的情況(例如大群體的現場培訓課程),您可能需要為每個用戶分配更高的 TPM。
減少代幣使用量
-
緊湊對話:
-
Claude 默認在上下文超過 95% 容量時使用自動緊湊
-
切換自動緊湊:運行
/config
並導航到「自動緊湊已啟用」 -
當上下文變大時手動使用
/compact
-
添加自定義指令:
/compact 專注於代碼示例和 API 使用
-
通過添加到 CLAUDE.md 來自定義緊湊:
-
-
編寫具體查詢: 避免觸發不必要掃描的模糊請求
-
分解複雜任務: 將大型任務分解為專注的互動
-
在任務之間清除歷史: 使用
/clear
重置上下文
成本可能會根據以下因素顯著變化:
- 被分析的代碼庫大小
- 查詢的複雜性
- 被搜索或修改的文件數量
- 對話歷史的長度
- 緊湊對話的頻率
- 背景進程(俳句生成、對話摘要)
背景代幣使用量
Claude Code 即使在空閒時也會為某些背景功能使用代幣:
- 俳句生成:您輸入時出現的小創意消息(大約每天 1 分錢)
- 對話摘要:為
claude --resume
功能摘要先前對話的背景作業 - 命令處理:某些命令如
/cost
可能會生成請求來檢查狀態
這些背景進程即使沒有主動互動也會消耗少量代幣(通常每個會話不到 $0.04)。
對於團隊部署,我們建議從小型試點組開始建立使用模式,然後再進行更廣泛的推廣。