Claude Code auf Google Vertex AI
Erfahren Sie mehr über die Konfiguration von Claude Code über Google Vertex AI, einschließlich Setup, IAM-Konfiguration und Fehlerbehebung.
Voraussetzungen
Bevor Sie Claude Code mit Vertex AI konfigurieren, stellen Sie sicher, dass Sie Folgendes haben:
- Ein Google Cloud Platform (GCP) Konto mit aktivierter Abrechnung
- Ein GCP-Projekt mit aktivierter Vertex AI API
- Zugang zu gewünschten Claude-Modellen (z.B. Claude Sonnet 4)
- Google Cloud SDK (
gcloud
) installiert und konfiguriert - Kontingent in der gewünschten GCP-Region zugewiesen
Vertex AI unterstützt möglicherweise die Claude Code Standard-Modelle nicht in anderen Regionen als us-east5
. Stellen Sie sicher, dass Sie us-east5
verwenden und Kontingent zugewiesen haben, oder wechseln Sie zu unterstützten Modellen.
Setup
1. Vertex AI API aktivieren
Aktivieren Sie die Vertex AI API in Ihrem GCP-Projekt:
2. Modellzugang anfordern
Fordern Sie Zugang zu Claude-Modellen in Vertex AI an:
- Navigieren Sie zum Vertex AI Model Garden
- Suchen Sie nach “Claude”-Modellen
- Fordern Sie Zugang zu gewünschten Claude-Modellen an (z.B. Claude Sonnet 4)
- Warten Sie auf die Genehmigung (kann 24-48 Stunden dauern)
3. GCP-Anmeldedaten konfigurieren
Claude Code verwendet die Standard-Google Cloud-Authentifizierung.
Weitere Informationen finden Sie in der Google Cloud-Authentifizierungsdokumentation.
4. Claude Code konfigurieren
Setzen Sie die folgenden Umgebungsvariablen:
Für erhöhte Ratenlimits und Aktivierung des Prompt-Cachings wenden Sie sich an den Google Cloud Support. Nach der Aktivierung entfernen Sie die DISABLE_PROMPT_CACHING
-Einstellung.
5. Modellkonfiguration
Claude Code verwendet diese Standard-Modelle für Vertex AI:
Modelltyp | Standardwert |
---|---|
Primäres Modell | claude-sonnet-4@20250514 |
Kleines/schnelles Modell | claude-3-5-haiku@20241022 |
Um Modelle anzupassen:
IAM-Konfiguration
Gewähren Sie die erforderlichen IAM-Rollen für Claude Code.
Einzelheiten finden Sie in der Vertex IAM-Dokumentation.
Wir empfehlen, ein dediziertes GCP-Projekt für Claude Code zu erstellen, um die Kostenverfolgung und Zugriffskontrolle zu vereinfachen.
Fehlerbehebung
Wenn Sie auf Kontingentprobleme stoßen:
- Überprüfen Sie aktuelle Kontingente oder fordern Sie eine Kontingenterhöhung über die Cloud Console an
Wenn Sie “Modell nicht gefunden” 404-Fehler erhalten:
- Überprüfen Sie, ob Sie Zugang zur angegebenen Region haben
- Bestätigen Sie, dass das Modell im Model Garden aktiviert ist
Wenn Sie 429-Fehler erhalten:
- Stellen Sie sicher, dass das primäre Modell und das kleine/schnelle Modell in Ihrer ausgewählten Region unterstützt werden