A API do Vertex para acessar o Claude é quase idêntica à API de Mensagens e suporta todas as mesmas opções, com duas diferenças principais:

  • No Vertex, model não é passado no corpo da requisição. Em vez disso, é especificado na URL do endpoint do Google Cloud.
  • No Vertex, anthropic_version é passado no corpo da requisição (em vez de como um cabeçalho), e deve ser definido com o valor vertex-2023-10-16.

O Vertex também é suportado pelos SDKs de cliente oficiais da Anthropic. Este guia irá orientá-lo através do processo de fazer uma requisição ao Claude no Vertex AI em Python ou TypeScript.

Note que este guia assume que você já tem um projeto GCP que é capaz de usar o Vertex AI. Veja usando os modelos Claude 3 da Anthropic para mais informações sobre a configuração necessária, bem como um passo a passo completo.

Instalar um SDK para acessar o Vertex AI

Primeiro, instale o SDK de cliente da Anthropic para sua linguagem de escolha.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Acessando o Vertex AI

Disponibilidade do Modelo

Note que a disponibilidade dos modelos da Anthropic varia por região. Pesquise por “Claude” no Vertex AI Model Garden ou vá para Use Claude 3 para as informações mais recentes.

Nomes dos modelos da API

ModeloNome do modelo da API do Vertex AI
Claude Opus 4claude-opus-4@20250514
Claude Sonnet 4claude-sonnet-4@20250514
Claude Sonnet 3.7claude-3-7-sonnet@20250219
Claude Haiku 3.5claude-3-5-haiku@20241022
Claude Sonnet 3.5claude-3-5-sonnet-v2@20241022
Claude Opus 3 (Visualização Pública)claude-3-opus@20240229
Claude Sonnet 3claude-3-sonnet@20240229
Claude Haiku 3claude-3-haiku@20240307

Fazendo requisições

Antes de executar requisições, você pode precisar executar gcloud auth application-default login para autenticar com o GCP.

Os seguintes exemplos mostram como gerar texto do Claude no Vertex AI:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
# Onde o modelo está executando
region = "us-east5"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4@20250514",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Oi Claude!",
        }
    ],
)
print(message)

Veja nossos SDKs de cliente e a documentação oficial do Vertex AI para mais detalhes.

Log de atividades

O Vertex fornece um serviço de log de requisição-resposta que permite aos clientes registrar os prompts e completions associados ao seu uso.

A Anthropic recomenda que você registre sua atividade em pelo menos uma base rotativa de 30 dias para entender sua atividade e investigar qualquer possível uso indevido.

Ativar este serviço não dá ao Google ou à Anthropic qualquer acesso ao seu conteúdo.

Suporte a recursos

Você pode encontrar todos os recursos atualmente suportados no Vertex aqui.