Bedrock, Vertex et proxys

Configuration du modèle

Par défaut, Claude Code utilise claude-opus-4-20250514. Vous pouvez remplacer cela en utilisant les variables d’environnement suivantes :

# API Anthropic
ANTHROPIC_MODEL='claude-opus-4-20250514'
ANTHROPIC_SMALL_FAST_MODEL='claude-3-5-haiku-20241022'

# Amazon Bedrock (avec ID de modèle)
ANTHROPIC_MODEL='us.anthropic.claude-opus-4-20250514-v1:0'
ANTHROPIC_SMALL_FAST_MODEL='us.anthropic.claude-3-5-haiku-20241022-v1:0'

# Amazon Bedrock (avec ARN de profil d'inférence)
ANTHROPIC_MODEL='arn:aws:bedrock:us-east-2:your-account-id:application-inference-profile/your-model-id'
ANTHROPIC_SMALL_FAST_MODEL='arn:aws:bedrock:us-east-2:your-account-id:application-inference-profile/your-small-model-id'

# Google Vertex AI
ANTHROPIC_MODEL='claude-3-7-sonnet@20250219'
ANTHROPIC_SMALL_FAST_MODEL='claude-3-5-haiku@20241022'

Vous pouvez également définir ces variables à l’aide de la configuration globale :

# Configuration pour l'API Anthropic
claude config set --global env '{"ANTHROPIC_MODEL": "claude-opus-4-20250514"}'

# Configuration pour Bedrock (avec ID de modèle)
claude config set --global env '{"CLAUDE_CODE_USE_BEDROCK": "true", "ANTHROPIC_MODEL": "us.anthropic.claude-opus-4-20250514-v1:0"}'

# Configuration pour Bedrock (avec ARN de profil d'inférence)
claude config set --global env '{"CLAUDE_CODE_USE_BEDROCK": "true", "ANTHROPIC_MODEL": "arn:aws:bedrock:us-east-2:your-account-id:application-inference-profile/your-model-id"}'

# Configuration pour Vertex AI
claude config set --global env '{"CLAUDE_CODE_USE_VERTEX": "true", "ANTHROPIC_MODEL": "claude-3-7-sonnet@20250219"}'

Consultez notre référence des noms de modèles pour tous les modèles disponibles auprès des différents fournisseurs.

Utilisation avec des API tierces

Claude Code nécessite l’accès aux modèles Claude Sonnet 3.7 et Claude Haiku 3.5, quel que soit le fournisseur d’API que vous utilisez.

Connexion à Amazon Bedrock

CLAUDE_CODE_USE_BEDROCK=1

Si vous n’avez pas activé la mise en cache des prompts, définissez également :

DISABLE_PROMPT_CACHING=1

Contactez Amazon Bedrock pour la mise en cache des prompts afin de réduire les coûts et d’augmenter les limites de taux.

Nécessite des identifiants AWS SDK standard (par exemple, ~/.aws/credentials ou des variables d’environnement pertinentes comme AWS_ACCESS_KEY_ID, AWS_SECRET_ACCESS_KEY). Pour configurer les identifiants AWS, exécutez :

aws configure

Si vous souhaitez accéder à Claude Code via un proxy, vous pouvez utiliser la variable d’environnement ANTHROPIC_BEDROCK_BASE_URL :

ANTHROPIC_BEDROCK_BASE_URL='https://your-proxy-url'

Si votre proxy gère ses propres identifiants AWS, vous pouvez utiliser la variable d’environnement CLAUDE_CODE_SKIP_BEDROCK_AUTH pour supprimer l’exigence de Claude Code concernant les identifiants AWS.

CLAUDE_CODE_SKIP_BEDROCK_AUTH=1

Les utilisateurs auront besoin d’accéder aux modèles Claude Sonnet 3.7 et Claude Haiku 3.5 dans leur compte AWS. Si vous avez un rôle d’accès au modèle, vous devrez peut-être demander l’accès à ces modèles s’ils ne sont pas déjà disponibles. L’accès à Bedrock dans chaque région est nécessaire car les profils d’inférence nécessitent une capacité inter-régions.

Connexion à Google Vertex AI

CLAUDE_CODE_USE_VERTEX=1
CLOUD_ML_REGION=us-east5
ANTHROPIC_VERTEX_PROJECT_ID=your-project-id

Si vous n’avez pas activé la mise en cache des prompts, définissez également :

DISABLE_PROMPT_CACHING=1

Claude Code sur Vertex AI ne prend actuellement en charge que la région us-east5. Assurez-vous que votre projet dispose d’un quota alloué dans cette région spécifique.

Les utilisateurs auront besoin d’accéder aux modèles Claude Sonnet 3.7 et Claude Haiku 3.5 dans leur projet Vertex AI.

Nécessite des identifiants GCP standard configurés via google-auth-library. Pour configurer les identifiants GCP, exécutez :

gcloud auth application-default login

Si vous souhaitez accéder à Claude Code via un proxy, vous pouvez utiliser la variable d’environnement ANTHROPIC_VERTEX_BASE_URL :

ANTHROPIC_VERTEX_BASE_URL='https://your-proxy-url'

Si votre proxy gère ses propres identifiants GCP, vous pouvez utiliser la variable d’environnement CLAUDE_CODE_SKIP_VERTEX_AUTH pour supprimer l’exigence de Claude Code concernant les identifiants GCP.

CLAUDE_CODE_SKIP_VERTEX_AUTH=1

Pour une meilleure expérience, contactez Google pour obtenir des limites de taux plus élevées.

Connexion via un proxy

Lorsque vous utilisez Claude Code avec un proxy LLM, vous pouvez contrôler le comportement d’authentification à l’aide des variables d’environnement et des configurations suivantes. Notez que vous pouvez combiner ces paramètres avec les paramètres spécifiques à Bedrock et Vertex.

Paramètres

Claude Code prend en charge un certain nombre de paramètres contrôlés via des variables d’environnement pour configurer l’utilisation avec Bedrock et Vertex. Consultez Variables d’environnement pour une référence complète.

Si vous préférez configurer via un fichier plutôt que des variables d’environnement, vous pouvez ajouter n’importe lequel de ces paramètres à l’objet env dans vos fichiers de paramètres Claude Code.

Vous pouvez également configurer le paramètre apiKeyHelper, pour définir un script shell personnalisé permettant d’obtenir une clé API (invoquée une fois au démarrage et mise en cache pendant la durée de chaque session, ou jusqu’à ce que CLAUDE_CODE_API_KEY_HELPER_TTL_MS s’écoule).

LiteLLM

LiteLLM est un service proxy tiers. Anthropic n’approuve, ne maintient ni n’audite la sécurité ou la fonctionnalité de LiteLLM. Ce guide est fourni à titre informatif et peut devenir obsolète. Utilisez-le à votre propre discrétion.

Cette section montre la configuration de Claude Code avec LiteLLM Proxy Server, un proxy LLM tiers qui offre le suivi de l’utilisation et des dépenses, l’authentification centralisée, la budgétisation par utilisateur, et plus encore.

Étape 1 : Prérequis

Claude Code mis à jour vers la dernière version
LiteLLM Proxy Server en cours d’exécution et accessible par le réseau à Claude Code
Votre clé proxy LiteLLM

Étape 2 : Configurer l’authentification du proxy

Choisissez l’une de ces méthodes d’authentification :

Option A : Clé proxy statique Définissez votre clé proxy comme variable d’environnement :

ANTHROPIC_AUTH_TOKEN=your-proxy-key

Option B : Clé proxy dynamique Si votre organisation utilise des clés rotatives ou une authentification dynamique :

Ne définissez pas la variable d’environnement ANTHROPIC_AUTH_TOKEN
Créez un script d’aide pour les clés afin de fournir des jetons d’authentification
Enregistrez le script sous la configuration apiKeyHelper dans vos paramètres Claude Code
Définissez la durée de vie du jeton pour permettre l’actualisation automatique :
```
CLAUDE_CODE_API_KEY_HELPER_TTL_MS=3600000
```
Définissez cette valeur sur la durée de vie (en millisecondes) des jetons renvoyés par votre apiKeyHelper.

Étape 3 : Configurer votre déploiement

Choisissez quel déploiement Claude vous souhaitez utiliser via LiteLLM :

API Anthropic : Connexion directe à l’API d’Anthropic
Bedrock : Amazon Bedrock avec les modèles Claude
Vertex AI : Google Cloud Vertex AI avec les modèles Claude

Option A : API Anthropic via LiteLLM

Configurez le point de terminaison LiteLLM :

ANTHROPIC_BASE_URL=https://litellm-url:4000/anthropic

Option B : Bedrock via LiteLLM

Configurez les paramètres Bedrock :

ANTHROPIC_BEDROCK_BASE_URL=https://litellm-url:4000/bedrock
CLAUDE_CODE_SKIP_BEDROCK_AUTH=1
CLAUDE_CODE_USE_BEDROCK=1

Option C : Vertex AI via LiteLLM

Recommandé : Identifiants spécifiés par le proxy

Configurez les paramètres Vertex :

ANTHROPIC_VERTEX_BASE_URL=https://litellm-url:4000/vertex_ai/v1
CLAUDE_CODE_SKIP_VERTEX_AUTH=1
CLAUDE_CODE_USE_VERTEX=1

Alternative : Identifiants spécifiés par le client

Si vous préférez utiliser des identifiants GCP locaux :

Authentifiez-vous localement avec GCP :
```
gcloud auth application-default login
```

Configurez les paramètres Vertex :

ANTHROPIC_VERTEX_BASE_URL=https://litellm-url:4000/vertex_ai/v1
ANTHROPIC_VERTEX_PROJECT_ID=your-gcp-project-id
CLAUDE_CODE_USE_VERTEX=1
CLOUD_ML_REGION=your-gcp-region

Mettez à jour la configuration d’en-tête LiteLLM :

Assurez-vous que votre configuration LiteLLM a general_settings.litellm_key_header_name défini sur Proxy-Authorization, car le jeton GCP transmis sera situé dans l’en-tête Authorization.

Étape 4. Sélection d’un modèle

Par défaut, les modèles utiliseront ceux spécifiés dans la Configuration du modèle.

Si vous avez configuré des noms de modèles personnalisés dans LiteLLM, définissez les variables d’environnement mentionnées précédemment avec ces noms personnalisés.

Pour des informations plus détaillées, consultez la documentation LiteLLM.

Release Notes

​Configuration du modèle

​Utilisation avec des API tierces

​Connexion à Amazon Bedrock

​Connexion à Google Vertex AI

​Connexion via un proxy

​Paramètres

​LiteLLM

​Étape 1 : Prérequis

​Étape 2 : Configurer l’authentification du proxy

​Étape 3 : Configurer votre déploiement

Option A : API Anthropic via LiteLLM

Option B : Bedrock via LiteLLM

Option C : Vertex AI via LiteLLM

​Étape 4. Sélection d’un modèle

Configuration du modèle

Utilisation avec des API tierces

Connexion à Amazon Bedrock

Connexion à Google Vertex AI

Connexion via un proxy

Paramètres

LiteLLM

Étape 1 : Prérequis

Étape 2 : Configurer l’authentification du proxy

Étape 3 : Configurer votre déploiement

Étape 4. Sélection d’un modèle