用于访问 Claude 的 Vertex API 与 Messages API 几乎完全相同,并支持所有相同的选项,但有两个关键区别:

  • 在 Vertex 中,model 不在请求体中传递。相反,它在 Google Cloud 端点 URL 中指定。
  • 在 Vertex 中,anthropic_version 在请求体中传递(而不是作为标头),并且必须设置为值 vertex-2023-10-16

Vertex 也受 Anthropic 官方客户端 SDK 支持。本指南将引导您完成在 Vertex AI 上使用 Python 或 TypeScript 向 Claude 发出请求的过程。

请注意,本指南假设您已经有一个能够使用 Vertex AI 的 GCP 项目。有关所需设置的更多信息以及完整的演练,请参阅 使用来自 Anthropic 的 Claude 3 模型

安装用于访问 Vertex AI 的 SDK

首先,为您选择的语言安装 Anthropic 的客户端 SDK

pip install -U google-cloud-aiplatform "anthropic[vertex]"

访问 Vertex AI

模型可用性

请注意,Anthropic 模型的可用性因地区而异。在 Vertex AI Model Garden 中搜索 “Claude” 或访问 使用 Claude 3 获取最新信息。

API 模型名称

模型Vertex AI API 模型名称
Claude Opus 4claude-opus-4@20250514
Claude Sonnet 4claude-sonnet-4@20250514
Claude Sonnet 3.7claude-3-7-sonnet@20250219
Claude Haiku 3.5claude-3-5-haiku@20241022
Claude Sonnet 3.5claude-3-5-sonnet-v2@20241022
Claude Opus 3 (公开预览版)claude-3-opus@20240229
Claude Sonnet 3claude-3-sonnet@20240229
Claude Haiku 3claude-3-haiku@20240307

发送请求

在运行请求之前,您可能需要运行 gcloud auth application-default login 来与 GCP 进行身份验证。

以下示例展示了如何在 Vertex AI 上从 Claude 生成文本:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
# 模型运行的位置
region = "us-east5"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4@20250514",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

有关更多详细信息,请参阅我们的客户端 SDK 和官方 Vertex AI 文档

活动日志记录

Vertex 提供了请求-响应日志记录服务,允许客户记录与您的使用相关的提示和完成内容。

Anthropic 建议您至少在 30 天滚动基础上记录您的活动,以了解您的活动并调查任何潜在的滥用。

开启此服务不会让 Google 或 Anthropic 访问您的内容。