L’API Vertex pour accéder à Claude est presque identique à l’API Messages et prend en charge toutes les mêmes options, avec deux différences clés :

  • Dans Vertex, model n’est pas passé dans le corps de la requête. Au lieu de cela, il est spécifié dans l’URL du point de terminaison Google Cloud.
  • Dans Vertex, anthropic_version est passé dans le corps de la requête (plutôt que comme en-tête), et doit être défini sur la valeur vertex-2023-10-16.

Vertex est également pris en charge par les SDK clients officiels d’Anthropic. Ce guide vous guidera à travers le processus de faire une requête à Claude sur Vertex AI en Python ou TypeScript.

Notez que ce guide suppose que vous avez déjà un projet GCP qui peut utiliser Vertex AI. Voir utilisation des modèles Claude 3 d’Anthropic pour plus d’informations sur la configuration requise, ainsi qu’une procédure complète.

Installer un SDK pour accéder à Vertex AI

Tout d’abord, installez le SDK client d’Anthropic pour le langage de votre choix.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Accéder à Vertex AI

Disponibilité des modèles

Notez que la disponibilité des modèles Anthropic varie selon la région. Recherchez “Claude” dans le Jardin de modèles Vertex AI ou allez à Utiliser Claude 3 pour les dernières informations.

Noms des modèles API

ModèleNom du modèle API Vertex AI
Claude Opus 4claude-opus-4@20250514
Claude Sonnet 4claude-sonnet-4@20250514
Claude Sonnet 3.7claude-3-7-sonnet@20250219
Claude Haiku 3.5claude-3-5-haiku@20241022
Claude Sonnet 3.5claude-3-5-sonnet-v2@20241022
Claude Opus 3 (Aperçu public)claude-3-opus@20240229
Claude Sonnet 3claude-3-sonnet@20240229
Claude Haiku 3claude-3-haiku@20240307

Faire des requêtes

Avant d’exécuter des requêtes, vous pourriez avoir besoin d’exécuter gcloud auth application-default login pour vous authentifier avec GCP.

Les exemples suivants montrent comment générer du texte à partir de Claude sur Vertex AI :

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
# Où le modèle s'exécute
region = "us-east5"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4@20250514",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Salut Claude !",
        }
    ],
)
print(message)

Voir nos SDK clients et la documentation officielle Vertex AI pour plus de détails.

Journalisation des activités

Vertex fournit un service de journalisation des requêtes-réponses qui permet aux clients de journaliser les invites et les complétions associées à votre utilisation.

Anthropic recommande que vous journalisiez votre activité sur au moins une base glissante de 30 jours afin de comprendre votre activité et d’enquêter sur toute utilisation abusive potentielle.

Activer ce service ne donne à Google ou Anthropic aucun accès à votre contenu.

Support des fonctionnalités

Vous pouvez trouver toutes les fonctionnalités actuellement prises en charge sur Vertex ici.