API do Vertex AI
Os modelos Claude da Anthropic estão agora disponíveis de forma geral através do Vertex AI.
A API do Vertex para acessar o Claude é quase idêntica à API de Mensagens e suporta todas as mesmas opções, com duas diferenças principais:
- No Vertex,
model
não é passado no corpo da requisição. Em vez disso, é especificado na URL do endpoint do Google Cloud. - No Vertex,
anthropic_version
é passado no corpo da requisição (em vez de como um cabeçalho), e deve ser definido com o valorvertex-2023-10-16
.
O Vertex também é suportado pelos SDKs de cliente oficiais da Anthropic. Este guia irá orientá-lo através do processo de fazer uma requisição ao Claude no Vertex AI em Python ou TypeScript.
Note que este guia assume que você já tem um projeto GCP que é capaz de usar o Vertex AI. Veja usando os modelos Claude 3 da Anthropic para mais informações sobre a configuração necessária, bem como um passo a passo completo.
Instalar um SDK para acessar o Vertex AI
Primeiro, instale o SDK de cliente da Anthropic para sua linguagem de escolha.
Acessando o Vertex AI
Disponibilidade do Modelo
Note que a disponibilidade dos modelos da Anthropic varia por região. Pesquise por “Claude” no Vertex AI Model Garden ou vá para Use Claude 3 para as informações mais recentes.
Nomes dos modelos da API
Modelo | Nome do modelo da API do Vertex AI |
---|---|
Claude Opus 4 | claude-opus-4@20250514 |
Claude Sonnet 4 | claude-sonnet-4@20250514 |
Claude Sonnet 3.7 | claude-3-7-sonnet@20250219 |
Claude Haiku 3.5 | claude-3-5-haiku@20241022 |
Claude Sonnet 3.5 | claude-3-5-sonnet-v2@20241022 |
Claude Opus 3 (Visualização Pública) | claude-3-opus@20240229 |
Claude Sonnet 3 | claude-3-sonnet@20240229 |
Claude Haiku 3 | claude-3-haiku@20240307 |
Fazendo requisições
Antes de executar requisições, você pode precisar executar gcloud auth application-default login
para autenticar com o GCP.
Os seguintes exemplos mostram como gerar texto do Claude no Vertex AI:
Veja nossos SDKs de cliente e a documentação oficial do Vertex AI para mais detalhes.
Log de atividades
O Vertex fornece um serviço de log de requisição-resposta que permite aos clientes registrar os prompts e completions associados ao seu uso.
A Anthropic recomenda que você registre sua atividade em pelo menos uma base rotativa de 30 dias para entender sua atividade e investigar qualquer possível uso indevido.
Ativar este serviço não dá ao Google ou à Anthropic qualquer acesso ao seu conteúdo.
Suporte a recursos
Você pode encontrar todos os recursos atualmente suportados no Vertex aqui.