Vertex API untuk mengakses Claude hampir identik dengan Messages API dan mendukung semua opsi yang sama, dengan dua perbedaan utama:

  • Di Vertex, model tidak diteruskan dalam request body. Sebaliknya, ini ditentukan dalam URL endpoint Google Cloud.
  • Di Vertex, anthropic_version diteruskan dalam request body (bukan sebagai header), dan harus diatur ke nilai vertex-2023-10-16.

Vertex juga didukung oleh client SDK resmi Anthropic. Panduan ini akan memandu Anda melalui proses membuat request ke Claude di Vertex AI baik dalam Python atau TypeScript.

Perhatikan bahwa panduan ini mengasumsikan Anda sudah memiliki proyek GCP yang dapat menggunakan Vertex AI. Lihat menggunakan model Claude 3 dari Anthropic untuk informasi lebih lanjut tentang pengaturan yang diperlukan, serta panduan lengkap.

Instal SDK untuk mengakses Vertex AI

Pertama, instal client SDK Anthropic untuk bahasa pilihan Anda.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Mengakses Vertex AI

Ketersediaan Model

Perhatikan bahwa ketersediaan model Anthropic bervariasi berdasarkan wilayah. Cari “Claude” di Vertex AI Model Garden atau kunjungi Use Claude 3 untuk informasi terbaru.

Nama model API

ModelNama model Vertex AI API
Claude Opus 4claude-opus-4@20250514
Claude Sonnet 4claude-sonnet-4@20250514
Claude Sonnet 3.7claude-3-7-sonnet@20250219
Claude Haiku 3.5claude-3-5-haiku@20241022
Claude Sonnet 3.5claude-3-5-sonnet-v2@20241022
Claude Opus 3 (Public Preview)claude-3-opus@20240229
Claude Sonnet 3claude-3-sonnet@20240229
Claude Haiku 3claude-3-haiku@20240307

Membuat request

Sebelum menjalankan request, Anda mungkin perlu menjalankan gcloud auth application-default login untuk melakukan autentikasi dengan GCP.

Contoh berikut menunjukkan cara menghasilkan teks dari Claude di Vertex AI:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
# Dimana model berjalan
region = "us-east5"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4@20250514",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Lihat client SDK kami dan dokumentasi Vertex AI resmi untuk detail lebih lanjut.

Pencatatan aktivitas

Vertex menyediakan layanan pencatatan request-response yang memungkinkan pelanggan untuk mencatat prompt dan completion yang terkait dengan penggunaan Anda.

Anthropic merekomendasikan agar Anda mencatat aktivitas Anda setidaknya dalam basis rolling 30 hari untuk memahami aktivitas Anda dan menyelidiki potensi penyalahgunaan.

Mengaktifkan layanan ini tidak memberikan Google atau Anthropic akses apa pun ke konten Anda.

Dukungan fitur

Anda dapat menemukan semua fitur yang saat ini didukung di Vertex di sini.