Claude에 접근하기 위한 Vertex API는 Messages API와 거의 동일하며 두 가지 주요 차이점을 제외하고 모든 동일한 옵션을 지원합니다:

  • Vertex에서는 model이 요청 본문에 전달되지 않습니다. 대신, Google Cloud 엔드포인트 URL에 지정됩니다.
  • Vertex에서는 anthropic_version이 요청 본문에 전달되며(헤더가 아닌), 값을 vertex-2023-10-16로 설정해야 합니다.

Vertex는 또한 Anthropic의 공식 클라이언트 SDK에서도 지원됩니다. 이 가이드는 Python 또는 TypeScript에서 Vertex AI의 Claude에 요청하는 과정을 안내합니다.

이 가이드는 이미 Vertex AI를 사용할 수 있는 GCP 프로젝트가 있다고 가정합니다. 필요한 설정과 전체 안내에 대한 자세한 내용은 Anthropic의 Claude 3 모델 사용하기를 참조하세요.

Vertex AI 접근을 위한 SDK 설치

먼저, 선택한 언어에 맞는 Anthropic의 클라이언트 SDK를 설치하세요.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Vertex AI 접근하기

모델 가용성

Anthropic 모델 가용성은 지역에 따라 다릅니다. Vertex AI Model Garden에서 “Claude”를 검색하거나 Claude 3 사용하기에서 최신 정보를 확인하세요.

API 모델 이름

모델Vertex AI API 모델 이름
Claude Opus 4claude-opus-4@20250514
Claude Sonnet 4claude-sonnet-4@20250514
Claude Sonnet 3.7claude-3-7-sonnet@20250219
Claude Haiku 3.5claude-3-5-haiku@20241022
Claude Sonnet 3.5claude-3-5-sonnet-v2@20241022
Claude Opus 3 (Public Preview)claude-3-opus@20240229
Claude Sonnet 3claude-3-sonnet@20240229
Claude Haiku 3claude-3-haiku@20240307

요청하기

요청을 실행하기 전에 GCP 인증을 위해 gcloud auth application-default login을 실행해야 할 수 있습니다.

다음 예제는 Vertex AI에서 Claude를 사용하여 텍스트를 생성하는 방법을 보여줍니다:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
# 모델이 실행되는 위치
region = "us-east5"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4@20250514",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

자세한 내용은 클라이언트 SDK와 공식 Vertex AI 문서를 참조하세요.

활동 로깅

Vertex는 사용자의 프롬프트와 완성 결과를 로깅할 수 있는 요청-응답 로깅 서비스를 제공합니다.

Anthropic은 활동을 이해하고 잠재적인 오용을 조사하기 위해 최소 30일 주기로 활동을 로깅할 것을 권장합니다.

이 서비스를 켜도 Google이나 Anthropic이 귀하의 콘텐츠에 접근할 수 없습니다.