Vertex API для доступа к Claude практически идентичен Messages API и поддерживает все те же опции, с двумя ключевыми отличиями:

  • В Vertex model не передается в теле запроса. Вместо этого он указывается в URL конечной точки Google Cloud.
  • В Vertex anthropic_version передается в теле запроса (а не как заголовок) и должен быть установлен в значение vertex-2023-10-16.

Vertex также поддерживается официальными клиентскими SDK от Anthropic. Это руководство проведет вас через процесс выполнения запроса к Claude на Vertex AI в Python или TypeScript.

Обратите внимание, что это руководство предполагает, что у вас уже есть проект GCP, который может использовать Vertex AI. См. использование моделей Claude 3 от Anthropic для получения дополнительной информации о необходимой настройке, а также полного пошагового руководства.

Установка SDK для доступа к Vertex AI

Сначала установите клиентский SDK от Anthropic для выбранного вами языка.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Доступ к Vertex AI

Доступность моделей

Обратите внимание, что доступность моделей Anthropic варьируется в зависимости от региона. Найдите “Claude” в Vertex AI Model Garden или перейдите к Использование Claude 3 для получения последней информации.

Имена моделей API

МодельИмя модели Vertex AI API
Claude Opus 4claude-opus-4@20250514
Claude Sonnet 4claude-sonnet-4@20250514
Claude Sonnet 3.7claude-3-7-sonnet@20250219
Claude Haiku 3.5claude-3-5-haiku@20241022
Claude Sonnet 3.5claude-3-5-sonnet-v2@20241022
Claude Opus 3 (Публичный предварительный просмотр)claude-3-opus@20240229
Claude Sonnet 3claude-3-sonnet@20240229
Claude Haiku 3claude-3-haiku@20240307

Выполнение запросов

Перед выполнением запросов вам может потребоваться запустить gcloud auth application-default login для аутентификации с GCP.

Следующие примеры показывают, как генерировать текст из Claude на Vertex AI:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
# Где работает модель
region = "us-east5"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4@20250514",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Привет, Claude!",
        }
    ],
)
print(message)

См. наши клиентские SDK и официальную документацию Vertex AI для получения более подробной информации.

Журналирование активности

Vertex предоставляет сервис журналирования запросов-ответов, который позволяет клиентам журналировать промпты и завершения, связанные с вашим использованием.

Anthropic рекомендует журналировать вашу активность как минимум на скользящей 30-дневной основе, чтобы понимать вашу активность и расследовать любое потенциальное неправильное использование.

Включение этого сервиса не дает Google или Anthropic никакого доступа к вашему контенту.

Поддержка функций

Вы можете найти все функции, которые в настоящее время поддерживаются на Vertex здесь.