A API Vertex para acessar o Claude é quase idêntica à API Messages e suporta todas as mesmas opções, com duas diferenças principais:

  • No Vertex, o model não é passado no corpo da requisição. Em vez disso, é especificado na URL do endpoint do Google Cloud.
  • No Vertex, o anthropic_version é passado no corpo da requisição (em vez de como um cabeçalho), e deve ser definido com o valor vertex-2023-10-16.

O Vertex também é suportado pelos SDKs de cliente oficiais da Anthropic. Este guia irá orientá-lo pelo processo de fazer uma requisição ao Claude no Vertex AI em Python ou TypeScript.

Observe que este guia pressupõe que você já tenha um projeto GCP que possa usar o Vertex AI. Consulte usando os modelos Claude 3 da Anthropic para mais informações sobre a configuração necessária, bem como um passo a passo completo.

Instalar um SDK para acessar o Vertex AI

Primeiro, instale o SDK de cliente da Anthropic para a linguagem de sua escolha.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Acessando o Vertex AI

Disponibilidade de Modelos

Observe que a disponibilidade dos modelos da Anthropic varia por região. Pesquise por “Claude” no Vertex AI Model Garden ou acesse Use Claude 3 para as informações mais recentes.

Nomes de modelos da API

ModeloNome do modelo na API Vertex AI
Claude Opus 4claude-opus-4@20250514
Claude Sonnet 4claude-sonnet-4@20250514
Claude Sonnet 3.7claude-3-7-sonnet@20250219
Claude Haiku 3.5claude-3-5-haiku@20241022
Claude Sonnet 3.5claude-3-5-sonnet-v2@20241022
Claude Opus 3 (Prévia Pública)claude-3-opus@20240229
Claude Sonnet 3claude-3-sonnet@20240229
Claude Haiku 3claude-3-haiku@20240307

Fazendo requisições

Antes de executar requisições, você pode precisar executar gcloud auth application-default login para autenticar com o GCP.

Os exemplos a seguir mostram como gerar texto do Claude no Vertex AI:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
# Onde o modelo está sendo executado
region = "us-east5"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4@20250514",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Consulte nossos SDKs de cliente e a documentação oficial do Vertex AI para mais detalhes.

Registro de atividades

O Vertex fornece um serviço de registro de requisição-resposta que permite aos clientes registrar os prompts e as respostas associadas ao seu uso.

A Anthropic recomenda que você registre sua atividade em uma base contínua de pelo menos 30 dias para entender sua atividade e investigar qualquer possível uso indevido.

Ativar este serviço não dá ao Google ou à Anthropic qualquer acesso ao seu conteúdo.