L’API Vertex pour accéder à Claude est presque identique à l’API Messages et prend en charge toutes les mêmes options, avec deux différences clés :

  • Dans Vertex, model n’est pas passé dans le corps de la requête. Au lieu de cela, il est spécifié dans l’URL de l’endpoint Google Cloud.
  • Dans Vertex, anthropic_version est passé dans le corps de la requête (plutôt que comme un en-tête), et doit être défini sur la valeur vertex-2023-10-16.

Vertex est également pris en charge par les SDK clients officiels d’Anthropic. Ce guide vous guidera à travers le processus d’envoi d’une requête à Claude sur Vertex AI en Python ou en TypeScript.

Notez que ce guide suppose que vous avez déjà un projet GCP capable d’utiliser Vertex AI. Consultez utilisation des modèles Claude 3 d’Anthropic pour plus d’informations sur la configuration requise, ainsi qu’un guide complet.

Installer un SDK pour accéder à Vertex AI

Tout d’abord, installez le SDK client d’Anthropic pour votre langage préféré.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Accéder à Vertex AI

Disponibilité des modèles

Notez que la disponibilité des modèles Anthropic varie selon les régions. Recherchez “Claude” dans le Vertex AI Model Garden ou allez sur Utiliser Claude 3 pour obtenir les dernières informations.

Noms de modèles API

ModèleNom du modèle Vertex AI API
Claude 3 Haikuclaude-3-haiku@20240307
Claude 3 Sonnetclaude-3-sonnet@20240229
Claude 3 Opus (Aperçu public)claude-3-opus@20240229

Effectuer des requêtes

Avant d’exécuter des requêtes, vous devrez peut-être exécuter gcloud auth application-default login pour vous authentifier auprès de GCP.

Les exemples suivants montrent comment générer du texte à partir de Claude 3 Haiku sur Vertex AI :

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
# Où le modèle est en cours d'exécution. par ex. us-central1 ou europe-west4 pour haiku
region = "MY_REGION"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-3-haiku@20240307",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Salut Claude !",
        }
    ],
)
print(message)

Consultez nos SDK clients et la documentation officielle de Vertex AI pour plus de détails.