La API de Vertex para acceder a Claude es casi idéntica a la API de Mensajes y admite todas las mismas opciones, con dos diferencias clave:

  • En Vertex, model no se pasa en el cuerpo de la solicitud. En su lugar, se especifica en la URL del endpoint de Google Cloud.
  • En Vertex, anthropic_version se pasa en el cuerpo de la solicitud (en lugar de como un encabezado), y debe establecerse en el valor vertex-2023-10-16.

Vertex también es compatible con los SDK de cliente oficiales de Anthropic. Esta guía lo guiará a través del proceso de realizar una solicitud a Claude en Vertex AI en Python o TypeScript.

Tenga en cuenta que esta guía asume que ya tiene un proyecto de GCP que puede usar Vertex AI. Consulte usando los modelos Claude 3 de Anthropic para obtener más información sobre la configuración requerida, así como un tutorial completo.

Instale un SDK para acceder a Vertex AI

Primero, instale el SDK de cliente de Anthropic para el lenguaje de su elección.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Accediendo a Vertex AI

Disponibilidad del modelo

Tenga en cuenta que la disponibilidad del modelo de Anthropic varía según la región. Busque “Claude” en el Jardín de Modelos de Vertex AI o vaya a Usar Claude 3 para obtener la información más reciente.

Nombres de modelos de API

ModeloNombre del modelo de la API de Vertex AI
Claude 3 Haikuclaude-3-haiku@20240307
Claude 3 Sonnetclaude-3-sonnet@20240229
Claude 3 Opus (Vista previa pública)claude-3-opus@20240229

Realizando solicitudes

Antes de ejecutar solicitudes, es posible que deba ejecutar gcloud auth application-default login para autenticarse con GCP.

Los siguientes ejemplos muestran cómo generar texto de Claude 3 Haiku en Vertex AI:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
# Donde se está ejecutando el modelo. p. ej. us-central1 o europe-west4 para haiku
region = "MY_REGION"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-3-haiku@20240307",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "¡Hola Claude!",
        }
    ],
)
print(message)

Consulte nuestros SDK de cliente y la documentación oficial de Vertex AI para obtener más detalles.