Konfigurasi model

Secara default, Claude Code menggunakan claude-opus-4-20250514. Anda dapat mengganti ini menggunakan variabel lingkungan berikut:

# Anthropic API
ANTHROPIC_MODEL='claude-opus-4-20250514'
ANTHROPIC_SMALL_FAST_MODEL='claude-3-5-haiku-20241022'

# Amazon Bedrock (dengan ID model)
ANTHROPIC_MODEL='us.anthropic.claude-opus-4-20250514-v1:0'
ANTHROPIC_SMALL_FAST_MODEL='us.anthropic.claude-3-5-haiku-20241022-v1:0'

# Amazon Bedrock (dengan ARN profil inferensi)
ANTHROPIC_MODEL='arn:aws:bedrock:us-east-2:your-account-id:application-inference-profile/your-model-id'
ANTHROPIC_SMALL_FAST_MODEL='arn:aws:bedrock:us-east-2:your-account-id:application-inference-profile/your-small-model-id'

# Google Vertex AI
ANTHROPIC_MODEL='claude-3-7-sonnet@20250219'
ANTHROPIC_SMALL_FAST_MODEL='claude-3-5-haiku@20241022'

Anda juga dapat mengatur variabel ini menggunakan konfigurasi global:

# Konfigurasi untuk Anthropic API
claude config set --global env '{"ANTHROPIC_MODEL": "claude-opus-4-20250514"}'

# Konfigurasi untuk Bedrock (dengan ID model)
claude config set --global env '{"CLAUDE_CODE_USE_BEDROCK": "true", "ANTHROPIC_MODEL": "us.anthropic.claude-opus-4-20250514-v1:0"}'

# Konfigurasi untuk Bedrock (dengan ARN profil inferensi)
claude config set --global env '{"CLAUDE_CODE_USE_BEDROCK": "true", "ANTHROPIC_MODEL": "arn:aws:bedrock:us-east-2:your-account-id:application-inference-profile/your-model-id"}'

# Konfigurasi untuk Vertex AI
claude config set --global env '{"CLAUDE_CODE_USE_VERTEX": "true", "ANTHROPIC_MODEL": "claude-3-7-sonnet@20250219"}'

Lihat referensi nama model kami untuk semua model yang tersedia di berbagai penyedia.

Penggunaan dengan API pihak ketiga

Claude Code memerlukan akses ke model Claude Sonnet 3.7 dan Claude Haiku 3.5, terlepas dari penyedia API mana yang Anda gunakan.

Terhubung ke Amazon Bedrock

CLAUDE_CODE_USE_BEDROCK=1

Jika Anda tidak mengaktifkan caching prompt, juga atur:

DISABLE_PROMPT_CACHING=1

Hubungi Amazon Bedrock untuk caching prompt guna mengurangi biaya dan meningkatkan batas rate.

Memerlukan kredensial AWS SDK standar (misalnya, ~/.aws/credentials atau variabel lingkungan yang relevan seperti AWS_ACCESS_KEY_ID, AWS_SECRET_ACCESS_KEY). Untuk mengatur kredensial AWS, jalankan:

aws configure

Jika Anda ingin mengakses Claude Code melalui proxy, Anda dapat menggunakan variabel lingkungan ANTHROPIC_BEDROCK_BASE_URL:

ANTHROPIC_BEDROCK_BASE_URL='https://your-proxy-url'

Jika proxy Anda memiliki kredensial AWS sendiri, Anda dapat menggunakan variabel lingkungan CLAUDE_CODE_SKIP_BEDROCK_AUTH untuk menghapus persyaratan Claude Code untuk kredensial AWS.

CLAUDE_CODE_SKIP_BEDROCK_AUTH=1

Pengguna akan memerlukan akses ke model Claude Sonnet 3.7 dan Claude Haiku 3.5 di akun AWS mereka. Jika Anda memiliki peran akses model, Anda mungkin perlu meminta akses ke model-model ini jika belum tersedia. Akses ke Bedrock di setiap wilayah diperlukan karena profil inferensi memerlukan kemampuan lintas wilayah.

Terhubung ke Google Vertex AI

CLAUDE_CODE_USE_VERTEX=1
CLOUD_ML_REGION=us-east5
ANTHROPIC_VERTEX_PROJECT_ID=your-project-id

Jika Anda tidak mengaktifkan caching prompt, juga atur:

DISABLE_PROMPT_CACHING=1

Claude Code di Vertex AI saat ini hanya mendukung wilayah us-east5. Pastikan proyek Anda memiliki kuota yang dialokasikan di wilayah spesifik ini.

Pengguna akan memerlukan akses ke model Claude Sonnet 3.7 dan Claude Haiku 3.5 di proyek Vertex AI mereka.

Memerlukan kredensial GCP standar yang dikonfigurasi melalui google-auth-library. Untuk mengatur kredensial GCP, jalankan:

gcloud auth application-default login

Jika Anda ingin mengakses Claude Code melalui proxy, Anda dapat menggunakan variabel lingkungan ANTHROPIC_VERTEX_BASE_URL:

ANTHROPIC_VERTEX_BASE_URL='https://your-proxy-url'

Jika proxy Anda memiliki kredensial GCP sendiri, Anda dapat menggunakan variabel lingkungan CLAUDE_CODE_SKIP_VERTEX_AUTH untuk menghapus persyaratan Claude Code untuk kredensial GCP.

CLAUDE_CODE_SKIP_VERTEX_AUTH=1

Untuk pengalaman terbaik, hubungi Google untuk batas rate yang lebih tinggi.

Terhubung melalui proxy

Saat menggunakan Claude Code dengan proxy LLM, Anda dapat mengontrol perilaku autentikasi menggunakan variabel lingkungan dan konfigurasi berikut. Perhatikan bahwa Anda dapat menggabungkan ini dengan pengaturan khusus Bedrock dan Vertex.

Pengaturan

Claude Code mendukung sejumlah pengaturan yang dikontrol melalui variabel lingkungan untuk mengonfigurasi penggunaan dengan Bedrock dan Vertex. Lihat Variabel lingkungan untuk referensi lengkap.

Jika Anda lebih suka mengonfigurasi melalui file daripada variabel lingkungan, Anda dapat menambahkan pengaturan ini ke objek env dalam file pengaturan Claude Code Anda.

Anda juga dapat mengonfigurasi pengaturan apiKeyHelper, untuk menetapkan skrip shell kustom untuk mendapatkan API key (dipanggil sekali saat startup, dan di-cache selama durasi setiap sesi, atau sampai CLAUDE_CODE_API_KEY_HELPER_TTL_MS berlalu).

LiteLLM

LiteLLM adalah layanan proxy pihak ketiga. Anthropic tidak mendukung, memelihara, atau mengaudit keamanan atau fungsionalitas LiteLLM. Panduan ini disediakan untuk tujuan informasi dan mungkin menjadi usang. Gunakan dengan kebijaksanaan Anda sendiri.

Bagian ini menunjukkan konfigurasi Claude Code dengan LiteLLM Proxy Server, proxy LLM pihak ketiga yang menawarkan pelacakan penggunaan dan pengeluaran, autentikasi terpusat, penganggaran per pengguna, dan lainnya.

Langkah 1: Prasyarat

  • Claude Code diperbarui ke versi terbaru
  • LiteLLM Proxy Server berjalan dan dapat diakses jaringan oleh Claude Code
  • Kunci proxy LiteLLM Anda

Langkah 2: Siapkan autentikasi proxy

Pilih salah satu metode autentikasi berikut:

Opsi A: Kunci proxy statis Atur kunci proxy Anda sebagai variabel lingkungan:

ANTHROPIC_AUTH_TOKEN=your-proxy-key

Opsi B: Kunci proxy dinamis Jika organisasi Anda menggunakan kunci yang berputar atau autentikasi dinamis:

  1. Jangan atur variabel lingkungan ANTHROPIC_AUTH_TOKEN
  2. Buat skrip pembantu kunci untuk menyediakan token autentikasi
  3. Daftarkan skrip di bawah konfigurasi apiKeyHelper dalam pengaturan Claude Code Anda
  4. Atur masa pakai token untuk mengaktifkan penyegaran otomatis:
    CLAUDE_CODE_API_KEY_HELPER_TTL_MS=3600000
    
    Atur ini ke masa pakai (dalam milidetik) token yang dikembalikan oleh apiKeyHelper Anda.

Langkah 3: Konfigurasikan deployment Anda

Pilih deployment Claude mana yang ingin Anda gunakan melalui LiteLLM:

  • Anthropic API: Koneksi langsung ke API Anthropic
  • Bedrock: Amazon Bedrock dengan model Claude
  • Vertex AI: Google Cloud Vertex AI dengan model Claude
Opsi A: Anthropic API melalui LiteLLM
  1. Konfigurasikan endpoint LiteLLM:
    ANTHROPIC_BASE_URL=https://litellm-url:4000/anthropic
    
Opsi B: Bedrock melalui LiteLLM
  1. Konfigurasikan pengaturan Bedrock:
    ANTHROPIC_BEDROCK_BASE_URL=https://litellm-url:4000/bedrock
    CLAUDE_CODE_SKIP_BEDROCK_AUTH=1
    CLAUDE_CODE_USE_BEDROCK=1
    
Opsi C: Vertex AI melalui LiteLLM

Direkomendasikan: Kredensial yang ditentukan proxy

  1. Konfigurasikan pengaturan Vertex:
    ANTHROPIC_VERTEX_BASE_URL=https://litellm-url:4000/vertex_ai/v1
    CLAUDE_CODE_SKIP_VERTEX_AUTH=1
    CLAUDE_CODE_USE_VERTEX=1
    

Alternatif: Kredensial yang ditentukan klien

Jika Anda lebih suka menggunakan kredensial GCP lokal:

  1. Autentikasi dengan GCP secara lokal:

    gcloud auth application-default login
    
  2. Konfigurasikan pengaturan Vertex:

    ANTHROPIC_VERTEX_BASE_URL=https://litellm-url:4000/vertex_ai/v1
    ANTHROPIC_VERTEX_PROJECT_ID=your-gcp-project-id
    CLAUDE_CODE_USE_VERTEX=1
    CLOUD_ML_REGION=your-gcp-region
    
  3. Perbarui konfigurasi header LiteLLM:

    Pastikan konfigurasi LiteLLM Anda memiliki general_settings.litellm_key_header_name yang diatur ke Proxy-Authorization, karena token GCP pass-through akan berada di header Authorization.

Langkah 4. Memilih model

Secara default, model akan menggunakan yang ditentukan dalam Konfigurasi model.

Jika Anda telah mengonfigurasi nama model kustom di LiteLLM, atur variabel lingkungan yang disebutkan sebelumnya ke nama kustom tersebut.

Untuk informasi lebih detail, lihat dokumentasi LiteLLM.