Claude Code sur Google Vertex AI
Apprenez à configurer Claude Code via Google Vertex AI, y compris la configuration, la configuration IAM et le dépannage.
Prérequis
Avant de configurer Claude Code avec Vertex AI, assurez-vous d’avoir :
- Un compte Google Cloud Platform (GCP) avec la facturation activée
- Un projet GCP avec l’API Vertex AI activée
- Accès aux modèles Claude souhaités (par exemple, Claude Sonnet 4)
- Google Cloud SDK (
gcloud
) installé et configuré - Quota alloué dans la région GCP souhaitée
Vertex AI peut ne pas prendre en charge les modèles par défaut de Claude Code sur les régions autres que us-east5
. Assurez-vous d’utiliser us-east5
et d’avoir un quota alloué, ou passez à des modèles pris en charge.
Configuration
1. Activer l’API Vertex AI
Activez l’API Vertex AI dans votre projet GCP :
2. Demander l’accès au modèle
Demandez l’accès aux modèles Claude dans Vertex AI :
- Naviguez vers le Jardin de modèles Vertex AI
- Recherchez les modèles “Claude”
- Demandez l’accès aux modèles Claude souhaités (par exemple, Claude Sonnet 4)
- Attendez l’approbation (peut prendre 24 à 48 heures)
3. Configurer les identifiants GCP
Claude Code utilise l’authentification Google Cloud standard.
Pour plus d’informations, consultez la documentation d’authentification Google Cloud.
Lors de l’authentification, Claude Code utilisera automatiquement l’ID de projet de la variable d’environnement ANTHROPIC_VERTEX_PROJECT_ID
. Pour remplacer cela, définissez l’une de ces variables d’environnement : GCLOUD_PROJECT
, GOOGLE_CLOUD_PROJECT
, ou GOOGLE_APPLICATION_CREDENTIALS
.
4. Configurer Claude Code
Définissez les variables d’environnement suivantes :
La mise en cache des invites est automatiquement prise en charge lorsque vous spécifiez le drapeau éphémère cache_control
. Pour la désactiver, définissez DISABLE_PROMPT_CACHING=1
. Pour des limites de taux accrues, contactez le support Google Cloud.
Lors de l’utilisation de Vertex AI, les commandes /login
et /logout
sont désactivées car l’authentification est gérée via les identifiants Google Cloud.
5. Configuration du modèle
Claude Code utilise ces modèles par défaut pour Vertex AI :
Type de modèle | Valeur par défaut |
---|---|
Modèle principal | claude-sonnet-4@20250514 |
Modèle petit/rapide | claude-3-5-haiku@20241022 |
Pour personnaliser les modèles :
Configuration IAM
Attribuez les permissions IAM requises :
Le rôle roles/aiplatform.user
inclut les permissions requises :
aiplatform.endpoints.predict
- Requis pour l’invocation de modèleaiplatform.endpoints.computeTokens
- Requis pour le comptage de jetons
Pour des permissions plus restrictives, créez un rôle personnalisé avec seulement les permissions ci-dessus.
Pour plus de détails, consultez la documentation IAM Vertex.
Nous recommandons de créer un projet GCP dédié pour Claude Code afin de simplifier le suivi des coûts et le contrôle d’accès.
Dépannage
Si vous rencontrez des problèmes de quota :
- Vérifiez les quotas actuels ou demandez une augmentation de quota via la Console Cloud
Si vous rencontrez des erreurs 404 “modèle non trouvé” :
- Vérifiez que vous avez accès à la région spécifiée
- Confirmez que le modèle est Activé dans le Jardin de modèles
Si vous rencontrez des erreurs 429 :
- Assurez-vous que le modèle principal et le modèle petit/rapide sont pris en charge dans votre région sélectionnée