API Vertex untuk mengakses Claude hampir identik dengan Messages API dan mendukung semua opsi yang sama, dengan dua perbedaan utama:

  • Di Vertex, model tidak diteruskan dalam body permintaan. Sebagai gantinya, model ditentukan dalam URL endpoint Google Cloud.
  • Di Vertex, anthropic_version diteruskan dalam body permintaan (bukan sebagai header), dan harus diatur ke nilai vertex-2023-10-16.

Vertex juga didukung oleh SDK klien resmi Anthropic. Panduan ini akan memandu Anda melalui proses membuat permintaan ke Claude di Vertex AI baik dalam Python atau TypeScript.

Perhatikan bahwa panduan ini mengasumsikan Anda sudah memiliki proyek GCP yang dapat menggunakan Vertex AI. Lihat menggunakan model Claude 3 dari Anthropic untuk informasi lebih lanjut tentang pengaturan yang diperlukan, serta panduan lengkap.

Menginstal SDK untuk mengakses Vertex AI

Pertama, instal SDK klien Anthropic untuk bahasa pilihan Anda.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Mengakses Vertex AI

Ketersediaan Model

Perhatikan bahwa ketersediaan model Anthropic bervariasi berdasarkan wilayah. Cari “Claude” di Vertex AI Model Garden atau kunjungi Use Claude 3 untuk informasi terbaru.

Nama model API

ModelNama model Vertex AI API
Claude Opus 4claude-opus-4@20250514
Claude Sonnet 4claude-sonnet-4@20250514
Claude Sonnet 3.7claude-3-7-sonnet@20250219
Claude Haiku 3.5claude-3-5-haiku@20241022
Claude Sonnet 3.5claude-3-5-sonnet-v2@20241022
Claude Opus 3 (Public Preview)claude-3-opus@20240229
Claude Sonnet 3claude-3-sonnet@20240229
Claude Haiku 3claude-3-haiku@20240307

Membuat permintaan

Sebelum menjalankan permintaan, Anda mungkin perlu menjalankan gcloud auth application-default login untuk mengautentikasi dengan GCP.

Contoh berikut menunjukkan cara menghasilkan teks dari Claude di Vertex AI:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
# Tempat model berjalan
region = "us-east5"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4@20250514",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Lihat SDK klien kami dan dokumentasi Vertex AI resmi untuk detail lebih lanjut.

Pencatatan aktivitas

Vertex menyediakan layanan pencatatan permintaan-respons yang memungkinkan pelanggan mencatat prompt dan respons terkait dengan penggunaan Anda.

Anthropic merekomendasikan agar Anda mencatat aktivitas Anda setidaknya dalam basis 30 hari berputar untuk memahami aktivitas Anda dan menyelidiki potensi penyalahgunaan.

Mengaktifkan layanan ini tidak memberikan akses kepada Google atau Anthropic ke konten Anda.