API Vertex AI
Les modèles Claude d’Anthropic sont maintenant généralement disponibles via Vertex AI.
L’API Vertex pour accéder à Claude est presque identique à l’API Messages et prend en charge toutes les mêmes options, avec deux différences clés :
- Dans Vertex,
model
n’est pas passé dans le corps de la requête. Au lieu de cela, il est spécifié dans l’URL du point de terminaison Google Cloud. - Dans Vertex,
anthropic_version
est passé dans le corps de la requête (plutôt que comme en-tête), et doit être défini sur la valeurvertex-2023-10-16
.
Vertex est également pris en charge par les SDK clients officiels d’Anthropic. Ce guide vous guidera à travers le processus de faire une requête à Claude sur Vertex AI en Python ou TypeScript.
Notez que ce guide suppose que vous avez déjà un projet GCP qui peut utiliser Vertex AI. Voir utilisation des modèles Claude 3 d’Anthropic pour plus d’informations sur la configuration requise, ainsi qu’une procédure complète.
Installer un SDK pour accéder à Vertex AI
Tout d’abord, installez le SDK client d’Anthropic pour le langage de votre choix.
Accéder à Vertex AI
Disponibilité des modèles
Notez que la disponibilité des modèles Anthropic varie selon la région. Recherchez “Claude” dans le Jardin de modèles Vertex AI ou allez à Utiliser Claude 3 pour les dernières informations.
Noms des modèles API
Modèle | Nom du modèle API Vertex AI |
---|---|
Claude Opus 4 | claude-opus-4@20250514 |
Claude Sonnet 4 | claude-sonnet-4@20250514 |
Claude Sonnet 3.7 | claude-3-7-sonnet@20250219 |
Claude Haiku 3.5 | claude-3-5-haiku@20241022 |
Claude Sonnet 3.5 | claude-3-5-sonnet-v2@20241022 |
Claude Opus 3 (Aperçu public) | claude-3-opus@20240229 |
Claude Sonnet 3 | claude-3-sonnet@20240229 |
Claude Haiku 3 | claude-3-haiku@20240307 |
Faire des requêtes
Avant d’exécuter des requêtes, vous pourriez avoir besoin d’exécuter gcloud auth application-default login
pour vous authentifier avec GCP.
Les exemples suivants montrent comment générer du texte à partir de Claude sur Vertex AI :
Voir nos SDK clients et la documentation officielle Vertex AI pour plus de détails.
Journalisation des activités
Vertex fournit un service de journalisation des requêtes-réponses qui permet aux clients de journaliser les invites et les complétions associées à votre utilisation.
Anthropic recommande que vous journalisiez votre activité sur au moins une base glissante de 30 jours afin de comprendre votre activité et d’enquêter sur toute utilisation abusive potentielle.
Activer ce service ne donne à Google ou Anthropic aucun accès à votre contenu.
Support des fonctionnalités
Vous pouvez trouver toutes les fonctionnalités actuellement prises en charge sur Vertex ici.