Configuration du modèle

Par défaut, Claude Code utilise claude-opus-4-20250514. Vous pouvez remplacer cela en utilisant les variables d’environnement suivantes :

# API Anthropic
ANTHROPIC_MODEL='claude-opus-4-20250514'
ANTHROPIC_SMALL_FAST_MODEL='claude-3-5-haiku-20241022'

# Amazon Bedrock (avec ID de modèle)
ANTHROPIC_MODEL='us.anthropic.claude-opus-4-20250514-v1:0'
ANTHROPIC_SMALL_FAST_MODEL='us.anthropic.claude-3-5-haiku-20241022-v1:0'

# Amazon Bedrock (avec ARN de profil d'inférence)
ANTHROPIC_MODEL='arn:aws:bedrock:us-east-2:your-account-id:application-inference-profile/your-model-id'
ANTHROPIC_SMALL_FAST_MODEL='arn:aws:bedrock:us-east-2:your-account-id:application-inference-profile/your-small-model-id'

# Google Vertex AI
ANTHROPIC_MODEL='claude-3-7-sonnet@20250219'
ANTHROPIC_SMALL_FAST_MODEL='claude-3-5-haiku@20241022'

Vous pouvez également définir ces variables à l’aide de la configuration globale :

# Configuration pour l'API Anthropic
claude config set --global env '{"ANTHROPIC_MODEL": "claude-opus-4-20250514"}'

# Configuration pour Bedrock (avec ID de modèle)
claude config set --global env '{"CLAUDE_CODE_USE_BEDROCK": "true", "ANTHROPIC_MODEL": "us.anthropic.claude-opus-4-20250514-v1:0"}'

# Configuration pour Bedrock (avec ARN de profil d'inférence)
claude config set --global env '{"CLAUDE_CODE_USE_BEDROCK": "true", "ANTHROPIC_MODEL": "arn:aws:bedrock:us-east-2:your-account-id:application-inference-profile/your-model-id"}'

# Configuration pour Vertex AI
claude config set --global env '{"CLAUDE_CODE_USE_VERTEX": "true", "ANTHROPIC_MODEL": "claude-3-7-sonnet@20250219"}'

Consultez notre référence des noms de modèles pour tous les modèles disponibles auprès des différents fournisseurs.

Utilisation avec des API tierces

Claude Code nécessite l’accès aux modèles Claude Sonnet 3.7 et Claude Haiku 3.5, quel que soit le fournisseur d’API que vous utilisez.

Connexion à Amazon Bedrock

CLAUDE_CODE_USE_BEDROCK=1

Si vous n’avez pas activé la mise en cache des prompts, définissez également :

DISABLE_PROMPT_CACHING=1

Contactez Amazon Bedrock pour la mise en cache des prompts afin de réduire les coûts et d’augmenter les limites de taux.

Nécessite des identifiants AWS SDK standard (par exemple, ~/.aws/credentials ou des variables d’environnement pertinentes comme AWS_ACCESS_KEY_ID, AWS_SECRET_ACCESS_KEY). Pour configurer les identifiants AWS, exécutez :

aws configure

Si vous souhaitez accéder à Claude Code via un proxy, vous pouvez utiliser la variable d’environnement ANTHROPIC_BEDROCK_BASE_URL :

ANTHROPIC_BEDROCK_BASE_URL='https://your-proxy-url'

Si votre proxy gère ses propres identifiants AWS, vous pouvez utiliser la variable d’environnement CLAUDE_CODE_SKIP_BEDROCK_AUTH pour supprimer l’exigence de Claude Code concernant les identifiants AWS.

CLAUDE_CODE_SKIP_BEDROCK_AUTH=1

Les utilisateurs auront besoin d’accéder aux modèles Claude Sonnet 3.7 et Claude Haiku 3.5 dans leur compte AWS. Si vous avez un rôle d’accès au modèle, vous devrez peut-être demander l’accès à ces modèles s’ils ne sont pas déjà disponibles. L’accès à Bedrock dans chaque région est nécessaire car les profils d’inférence nécessitent une capacité inter-régions.

Connexion à Google Vertex AI

CLAUDE_CODE_USE_VERTEX=1
CLOUD_ML_REGION=us-east5
ANTHROPIC_VERTEX_PROJECT_ID=your-project-id

Si vous n’avez pas activé la mise en cache des prompts, définissez également :

DISABLE_PROMPT_CACHING=1

Claude Code sur Vertex AI ne prend actuellement en charge que la région us-east5. Assurez-vous que votre projet dispose d’un quota alloué dans cette région spécifique.

Les utilisateurs auront besoin d’accéder aux modèles Claude Sonnet 3.7 et Claude Haiku 3.5 dans leur projet Vertex AI.

Nécessite des identifiants GCP standard configurés via google-auth-library. Pour configurer les identifiants GCP, exécutez :

gcloud auth application-default login

Si vous souhaitez accéder à Claude Code via un proxy, vous pouvez utiliser la variable d’environnement ANTHROPIC_VERTEX_BASE_URL :

ANTHROPIC_VERTEX_BASE_URL='https://your-proxy-url'

Si votre proxy gère ses propres identifiants GCP, vous pouvez utiliser la variable d’environnement CLAUDE_CODE_SKIP_VERTEX_AUTH pour supprimer l’exigence de Claude Code concernant les identifiants GCP.

CLAUDE_CODE_SKIP_VERTEX_AUTH=1

Pour une meilleure expérience, contactez Google pour obtenir des limites de taux plus élevées.

Connexion via un proxy

Lorsque vous utilisez Claude Code avec un proxy LLM, vous pouvez contrôler le comportement d’authentification à l’aide des variables d’environnement et des configurations suivantes. Notez que vous pouvez combiner ces paramètres avec les paramètres spécifiques à Bedrock et Vertex.

Paramètres

Claude Code prend en charge un certain nombre de paramètres contrôlés via des variables d’environnement pour configurer l’utilisation avec Bedrock et Vertex. Consultez Variables d’environnement pour une référence complète.

Si vous préférez configurer via un fichier plutôt que des variables d’environnement, vous pouvez ajouter n’importe lequel de ces paramètres à l’objet env dans vos fichiers de paramètres Claude Code.

Vous pouvez également configurer le paramètre apiKeyHelper, pour définir un script shell personnalisé permettant d’obtenir une clé API (invoquée une fois au démarrage et mise en cache pendant la durée de chaque session, ou jusqu’à ce que CLAUDE_CODE_API_KEY_HELPER_TTL_MS s’écoule).

LiteLLM

LiteLLM est un service proxy tiers. Anthropic n’approuve, ne maintient ni n’audite la sécurité ou la fonctionnalité de LiteLLM. Ce guide est fourni à titre informatif et peut devenir obsolète. Utilisez-le à votre propre discrétion.

Cette section montre la configuration de Claude Code avec LiteLLM Proxy Server, un proxy LLM tiers qui offre le suivi de l’utilisation et des dépenses, l’authentification centralisée, la budgétisation par utilisateur, et plus encore.

Étape 1 : Prérequis

  • Claude Code mis à jour vers la dernière version
  • LiteLLM Proxy Server en cours d’exécution et accessible par le réseau à Claude Code
  • Votre clé proxy LiteLLM

Étape 2 : Configurer l’authentification du proxy

Choisissez l’une de ces méthodes d’authentification :

Option A : Clé proxy statique Définissez votre clé proxy comme variable d’environnement :

ANTHROPIC_AUTH_TOKEN=your-proxy-key

Option B : Clé proxy dynamique Si votre organisation utilise des clés rotatives ou une authentification dynamique :

  1. Ne définissez pas la variable d’environnement ANTHROPIC_AUTH_TOKEN
  2. Créez un script d’aide pour les clés afin de fournir des jetons d’authentification
  3. Enregistrez le script sous la configuration apiKeyHelper dans vos paramètres Claude Code
  4. Définissez la durée de vie du jeton pour permettre l’actualisation automatique :
    CLAUDE_CODE_API_KEY_HELPER_TTL_MS=3600000
    
    Définissez cette valeur sur la durée de vie (en millisecondes) des jetons renvoyés par votre apiKeyHelper.

Étape 3 : Configurer votre déploiement

Choisissez quel déploiement Claude vous souhaitez utiliser via LiteLLM :

  • API Anthropic : Connexion directe à l’API d’Anthropic
  • Bedrock : Amazon Bedrock avec les modèles Claude
  • Vertex AI : Google Cloud Vertex AI avec les modèles Claude
Option A : API Anthropic via LiteLLM
  1. Configurez le point de terminaison LiteLLM :
    ANTHROPIC_BASE_URL=https://litellm-url:4000/anthropic
    
Option B : Bedrock via LiteLLM
  1. Configurez les paramètres Bedrock :
    ANTHROPIC_BEDROCK_BASE_URL=https://litellm-url:4000/bedrock
    CLAUDE_CODE_SKIP_BEDROCK_AUTH=1
    CLAUDE_CODE_USE_BEDROCK=1
    
Option C : Vertex AI via LiteLLM

Recommandé : Identifiants spécifiés par le proxy

  1. Configurez les paramètres Vertex :
    ANTHROPIC_VERTEX_BASE_URL=https://litellm-url:4000/vertex_ai/v1
    CLAUDE_CODE_SKIP_VERTEX_AUTH=1
    CLAUDE_CODE_USE_VERTEX=1
    

Alternative : Identifiants spécifiés par le client

Si vous préférez utiliser des identifiants GCP locaux :

  1. Authentifiez-vous localement avec GCP :

    gcloud auth application-default login
    
  2. Configurez les paramètres Vertex :

    ANTHROPIC_VERTEX_BASE_URL=https://litellm-url:4000/vertex_ai/v1
    ANTHROPIC_VERTEX_PROJECT_ID=your-gcp-project-id
    CLAUDE_CODE_USE_VERTEX=1
    CLOUD_ML_REGION=your-gcp-region
    
  3. Mettez à jour la configuration d’en-tête LiteLLM :

    Assurez-vous que votre configuration LiteLLM a general_settings.litellm_key_header_name défini sur Proxy-Authorization, car le jeton GCP transmis sera situé dans l’en-tête Authorization.

Étape 4. Sélection d’un modèle

Par défaut, les modèles utiliseront ceux spécifiés dans la Configuration du modèle.

Si vous avez configuré des noms de modèles personnalisés dans LiteLLM, définissez les variables d’environnement mentionnées précédemment avec ces noms personnalisés.

Pour des informations plus détaillées, consultez la documentation LiteLLM.