L’API Vertex pour accéder à Claude est presque identique à l’API Messages et prend en charge toutes les mêmes options, avec deux différences clés :

  • Dans Vertex, model n’est pas transmis dans le corps de la requête. Au lieu de cela, il est spécifié dans l’URL du point de terminaison Google Cloud.
  • Dans Vertex, anthropic_version est transmis dans le corps de la requête (plutôt que comme en-tête), et doit être défini sur la valeur vertex-2023-10-16.

Vertex est également pris en charge par les SDK clients officiels d’Anthropic. Ce guide vous accompagnera dans le processus de création d’une requête à Claude sur Vertex AI en Python ou TypeScript.

Notez que ce guide suppose que vous disposez déjà d’un projet GCP capable d’utiliser Vertex AI. Consultez utilisation des modèles Claude 3 d’Anthropic pour plus d’informations sur la configuration requise, ainsi qu’un guide complet.

Installer un SDK pour accéder à Vertex AI

Tout d’abord, installez le SDK client d’Anthropic pour le langage de votre choix.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Accéder à Vertex AI

Disponibilité des modèles

Notez que la disponibilité des modèles Anthropic varie selon la région. Recherchez “Claude” dans le Vertex AI Model Garden ou consultez Utiliser Claude 3 pour les informations les plus récentes.

Noms des modèles API

ModèleNom du modèle dans l’API Vertex AI
Claude Opus 4claude-opus-4@20250514
Claude Sonnet 4claude-sonnet-4@20250514
Claude Sonnet 3.7claude-3-7-sonnet@20250219
Claude Haiku 3.5claude-3-5-haiku@20241022
Claude Sonnet 3.5claude-3-5-sonnet-v2@20241022
Claude Opus 3 (Aperçu public)claude-3-opus@20240229
Claude Sonnet 3claude-3-sonnet@20240229
Claude Haiku 3claude-3-haiku@20240307

Effectuer des requêtes

Avant d’exécuter des requêtes, vous devrez peut-être exécuter gcloud auth application-default login pour vous authentifier auprès de GCP.

Les exemples suivants montrent comment générer du texte à partir de Claude sur Vertex AI :

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
# Où le modèle est exécuté
region = "us-east5"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4@20250514",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Consultez nos SDK clients et la documentation officielle de Vertex AI pour plus de détails.

Journalisation des activités

Vertex fournit un service de journalisation des requêtes-réponses qui permet aux clients d’enregistrer les prompts et les compléments associés à votre utilisation.

Anthropic recommande que vous enregistriez votre activité sur une base continue d’au moins 30 jours afin de comprendre votre activité et d’enquêter sur toute utilisation abusive potentielle.

L’activation de ce service ne donne à Google ou Anthropic aucun accès à votre contenu.