Vertex AI API
Os modelos Claude da Anthropic agora estão geralmente disponíveis através do Vertex AI.
A API Vertex para acessar o Claude é quase idêntica à API Messages e suporta todas as mesmas opções, com duas diferenças principais:
- No Vertex, o
model
não é passado no corpo da requisição. Em vez disso, é especificado na URL do endpoint do Google Cloud. - No Vertex, o
anthropic_version
é passado no corpo da requisição (em vez de como um cabeçalho), e deve ser definido com o valorvertex-2023-10-16
.
O Vertex também é suportado pelos SDKs de cliente oficiais da Anthropic. Este guia irá orientá-lo pelo processo de fazer uma requisição ao Claude no Vertex AI em Python ou TypeScript.
Observe que este guia pressupõe que você já tenha um projeto GCP que possa usar o Vertex AI. Consulte usando os modelos Claude 3 da Anthropic para mais informações sobre a configuração necessária, bem como um passo a passo completo.
Instalar um SDK para acessar o Vertex AI
Primeiro, instale o SDK de cliente da Anthropic para a linguagem de sua escolha.
Acessando o Vertex AI
Disponibilidade de Modelos
Observe que a disponibilidade dos modelos da Anthropic varia por região. Pesquise por “Claude” no Vertex AI Model Garden ou acesse Use Claude 3 para as informações mais recentes.
Nomes de modelos da API
Modelo | Nome do modelo na API Vertex AI |
---|---|
Claude Opus 4 | claude-opus-4@20250514 |
Claude Sonnet 4 | claude-sonnet-4@20250514 |
Claude Sonnet 3.7 | claude-3-7-sonnet@20250219 |
Claude Haiku 3.5 | claude-3-5-haiku@20241022 |
Claude Sonnet 3.5 | claude-3-5-sonnet-v2@20241022 |
Claude Opus 3 (Prévia Pública) | claude-3-opus@20240229 |
Claude Sonnet 3 | claude-3-sonnet@20240229 |
Claude Haiku 3 | claude-3-haiku@20240307 |
Fazendo requisições
Antes de executar requisições, você pode precisar executar gcloud auth application-default login
para autenticar com o GCP.
Os exemplos a seguir mostram como gerar texto do Claude no Vertex AI:
Consulte nossos SDKs de cliente e a documentação oficial do Vertex AI para mais detalhes.
Registro de atividades
O Vertex fornece um serviço de registro de requisição-resposta que permite aos clientes registrar os prompts e as respostas associadas ao seu uso.
A Anthropic recomenda que você registre sua atividade em uma base contínua de pelo menos 30 dias para entender sua atividade e investigar qualquer possível uso indevido.
Ativar este serviço não dá ao Google ou à Anthropic qualquer acesso ao seu conteúdo.