API Vertex для доступа к Claude практически идентичен API сообщений и поддерживает все те же опции, с двумя ключевыми отличиями:

  • В Vertex параметр model не передается в теле запроса. Вместо этого он указывается в URL-адресе конечной точки Google Cloud.
  • В Vertex параметр anthropic_version передается в теле запроса (а не как заголовок) и должен иметь значение vertex-2023-10-16.

Vertex также поддерживается официальными клиентскими SDK от Anthropic. Это руководство проведет вас через процесс отправки запроса к Claude на Vertex AI на Python или TypeScript.

Обратите внимание, что это руководство предполагает, что у вас уже есть проект GCP, который может использовать Vertex AI. Дополнительную информацию о необходимой настройке, а также полное руководство см. в разделе использование моделей Claude 3 от Anthropic.

Установка SDK для доступа к Vertex AI

Сначала установите клиентский SDK Anthropic для выбранного вами языка.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Доступ к Vertex AI

Доступность моделей

Обратите внимание, что доступность моделей Anthropic варьируется в зависимости от региона. Выполните поиск “Claude” в Vertex AI Model Garden или перейдите к Use Claude 3 для получения актуальной информации.

Названия моделей API

МодельНазвание модели Vertex AI API
Claude Opus 4claude-opus-4@20250514
Claude Sonnet 4claude-sonnet-4@20250514
Claude Sonnet 3.7claude-3-7-sonnet@20250219
Claude Haiku 3.5claude-3-5-haiku@20241022
Claude Sonnet 3.5claude-3-5-sonnet-v2@20241022
Claude Opus 3 (Public Preview)claude-3-opus@20240229
Claude Sonnet 3claude-3-sonnet@20240229
Claude Haiku 3claude-3-haiku@20240307

Отправка запросов

Перед выполнением запросов вам может потребоваться выполнить команду gcloud auth application-default login для аутентификации в GCP.

В следующих примерах показано, как генерировать текст с помощью Claude на Vertex AI:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
# Где запущена модель
region = "us-east5"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4@20250514",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Дополнительную информацию см. в наших клиентских SDK и официальной документации Vertex AI.

Журналирование активности

Vertex предоставляет сервис журналирования запросов и ответов, который позволяет клиентам регистрировать запросы и ответы, связанные с вашим использованием.

Anthropic рекомендует вести журнал вашей активности как минимум на скользящей основе в течение 30 дней, чтобы понимать вашу активность и расследовать любое потенциальное злоупотребление.

Включение этого сервиса не дает Google или Anthropic доступа к вашему контенту.