La API de Vertex para acceder a Claude es casi idéntica a la API de Messages y admite todas las mismas opciones, con dos diferencias clave:

  • En Vertex, model no se pasa en el cuerpo de la solicitud. En su lugar, se especifica en la URL del endpoint de Google Cloud.
  • En Vertex, anthropic_version se pasa en el cuerpo de la solicitud (en lugar de como un encabezado), y debe establecerse al valor vertex-2023-10-16.

Vertex también es compatible con los SDKs oficiales del cliente de Anthropic. Esta guía te llevará a través del proceso de hacer una solicitud a Claude en Vertex AI ya sea en Python o TypeScript.

Ten en cuenta que esta guía asume que ya tienes un proyecto de GCP que puede usar Vertex AI. Consulta usar los modelos Claude 3 de Anthropic para más información sobre la configuración requerida, así como un tutorial completo.

Instalar un SDK para acceder a Vertex AI

Primero, instala el SDK del cliente de Anthropic para tu lenguaje de elección.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Accediendo a Vertex AI

Disponibilidad del Modelo

Ten en cuenta que la disponibilidad del modelo de Anthropic varía por región. Busca “Claude” en el Jardín de Modelos de Vertex AI o ve a Usar Claude 3 para la información más reciente.

Nombres de modelos de API

ModeloNombre del modelo de API de Vertex AI
Claude Opus 4claude-opus-4@20250514
Claude Sonnet 4claude-sonnet-4@20250514
Claude Sonnet 3.7claude-3-7-sonnet@20250219
Claude Haiku 3.5claude-3-5-haiku@20241022
Claude Sonnet 3.5claude-3-5-sonnet-v2@20241022
Claude Opus 3 (Vista Previa Pública)claude-3-opus@20240229
Claude Sonnet 3claude-3-sonnet@20240229
Claude Haiku 3claude-3-haiku@20240307

Haciendo solicitudes

Antes de ejecutar solicitudes, es posible que necesites ejecutar gcloud auth application-default login para autenticarte con GCP.

Los siguientes ejemplos muestran cómo generar texto desde Claude en Vertex AI:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
# Donde está ejecutándose el modelo
region = "us-east5"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4@20250514",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "¡Hola Claude!",
        }
    ],
)
print(message)

Consulta nuestros SDKs del cliente y la documentación oficial de Vertex AI para más detalles.

Registro de actividad

Vertex proporciona un servicio de registro de solicitud-respuesta que permite a los clientes registrar los prompts y completaciones asociados con tu uso.

Anthropic recomienda que registres tu actividad al menos en una base rotativa de 30 días para entender tu actividad e investigar cualquier posible mal uso.

Activar este servicio no le da a Google o Anthropic ningún acceso a tu contenido.

Soporte de características

Puedes encontrar todas las características actualmente compatibles en Vertex aquí.