部署
Google Vertex AI 上的 Claude Code
了解如何透過 Google Vertex AI 配置 Claude Code,包括設定、IAM 配置和疑難排解。
先決條件
在使用 Vertex AI 配置 Claude Code 之前,請確保您具備:
- 已啟用計費的 Google Cloud Platform (GCP) 帳戶
- 已啟用 Vertex AI API 的 GCP 專案
- 存取所需的 Claude 模型(例如 Claude Sonnet 4)
- 已安裝並配置的 Google Cloud SDK (
gcloud
) - 在所需的 GCP 區域中分配的配額
Vertex AI 可能不支援非 us-east5
區域的 Claude Code 預設模型。請確保您使用 us-east5
並已分配配額,或切換到支援的模型。
設定
1. 啟用 Vertex AI API
在您的 GCP 專案中啟用 Vertex AI API:
2. 請求模型存取權限
在 Vertex AI 中請求 Claude 模型的存取權限:
- 導航至 Vertex AI Model Garden
- 搜尋「Claude」模型
- 請求存取所需的 Claude 模型(例如 Claude Sonnet 4)
- 等待核准(可能需要 24-48 小時)
3. 配置 GCP 憑證
Claude Code 使用標準的 Google Cloud 驗證。
如需更多資訊,請參閱 Google Cloud 驗證文件。
4. 配置 Claude Code
設定以下環境變數:
若要提高速率限制並啟用提示快取,請聯絡 Google Cloud 支援。啟用後,請移除 DISABLE_PROMPT_CACHING
設定。
5. 模型配置
Claude Code 對 Vertex AI 使用這些預設模型:
模型類型 | 預設值 |
---|---|
主要模型 | claude-sonnet-4@20250514 |
小型/快速模型 | claude-3-5-haiku@20241022 |
若要自訂模型:
IAM 配置
為 Claude Code 授予所需的 IAM 角色。
如需詳細資訊,請參閱 Vertex IAM 文件。
我們建議為 Claude Code 建立專用的 GCP 專案,以簡化成本追蹤和存取控制。
疑難排解
如果您遇到配額問題:
- 透過 Cloud Console 檢查目前配額或請求增加配額
如果您遇到「找不到模型」404 錯誤:
- 驗證您是否有權存取指定的區域
- 確認模型在 Model Garden 中已啟用
如果您遇到 429 錯誤:
- 確保主要模型和小型/快速模型在您選擇的區域中受到支援