Claude Code 每次互動都會消耗代幣。平均成本為每位開發者每天 6906,90% 的用戶每日成本保持在 12 以下。

對於團隊使用,Claude Code 按 API 代幣消耗量收費。平均而言,使用 Sonnet 4 的 Claude Code 每位開發者每月成本約為 $100-200,但根據用戶運行的實例數量以及是否在自動化中使用,會有很大的差異。

追蹤您的成本

  • 使用 /cost 查看當前會話使用量
  • Anthropic Console 用戶
  • Pro 和 Max 方案用戶:使用量包含在您的訂閱中

為團隊管理成本

使用 Anthropic API 時,您可以限制 Claude Code 工作區的總支出。要配置,請按照這些說明操作。管理員可以通過按照這些說明操作查看成本和使用量報告。

在 Bedrock 和 Vertex 上,Claude Code 不會從您的雲端發送指標。為了獲取成本指標,幾家大型企業報告使用了 LiteLLM,這是一個開源工具,幫助公司按密鑰追蹤支出。此項目與 Anthropic 無關,我們尚未審核其安全性。

速率限制建議

為團隊設置 Claude Code 時,請根據您的組織規模考慮這些每用戶每分鐘代幣數(TPM)和每分鐘請求數(RPM)建議:

團隊規模每用戶 TPM每用戶 RPM
1-5 用戶200k-300k5-7
5-20 用戶100k-150k2.5-3.5
20-50 用戶50k-75k1.25-1.75
50-100 用戶25k-35k0.62-0.87
100-500 用戶15k-20k0.37-0.47
500+ 用戶10k-15k0.25-0.35

例如,如果您有 200 個用戶,您可能會為每個用戶請求 20k TPM,或總共 400 萬 TPM(200*20,000 = 400 萬)。

隨著團隊規模的增長,每用戶 TPM 會減少,因為我們預期在較大的組織中同時使用 Claude Code 的用戶會更少。這些速率限制適用於組織級別,而不是每個個人用戶,這意味著當其他人沒有積極使用服務時,個人用戶可以暫時消耗超過其計算份額。

如果您預期會出現異常高並發使用的情況(例如大群體的現場培訓課程),您可能需要為每個用戶分配更高的 TPM。

減少代幣使用量

  • 緊湊對話:

    • Claude 默認在上下文超過 95% 容量時使用自動緊湊

    • 切換自動緊湊:運行 /config 並導航到「自動緊湊已啟用」

    • 當上下文變大時手動使用 /compact

    • 添加自定義指令:/compact 專注於代碼示例和 API 使用

    • 通過添加到 CLAUDE.md 來自定義緊湊:

      # 摘要指令
      
      當您使用緊湊時,請專注於測試輸出和代碼更改
      
  • 編寫具體查詢: 避免觸發不必要掃描的模糊請求

  • 分解複雜任務: 將大型任務分解為專注的互動

  • 在任務之間清除歷史: 使用 /clear 重置上下文

成本可能會根據以下因素顯著變化:

  • 被分析的代碼庫大小
  • 查詢的複雜性
  • 被搜索或修改的文件數量
  • 對話歷史的長度
  • 緊湊對話的頻率
  • 背景進程(俳句生成、對話摘要)

背景代幣使用量

Claude Code 即使在空閒時也會為某些背景功能使用代幣:

  • 俳句生成:您輸入時出現的小創意消息(大約每天 1 分錢)
  • 對話摘要:為 claude --resume 功能摘要先前對話的背景作業
  • 命令處理:某些命令如 /cost 可能會生成請求來檢查狀態

這些背景進程即使沒有主動互動也會消耗少量代幣(通常每個會話不到 $0.04)。

對於團隊部署,我們建議從小型試點組開始建立使用模式,然後再進行更廣泛的推廣。