Kelola biaya secara efektif

Claude Code mengonsumsi token untuk setiap interaksi. Biaya rata-rata adalah $6 per pengembang per hari, dengan biaya harian tetap di bawah$ 12 untuk 90% pengguna.

Untuk penggunaan tim, Claude Code mengenakan biaya berdasarkan konsumsi token API. Rata-rata, Claude Code menghabiskan biaya ~$100-200/pengembang per bulan dengan Sonnet 4 meskipun ada variasi besar tergantung pada berapa banyak instance yang dijalankan pengguna dan apakah mereka menggunakannya dalam otomatisasi.

Lacak biaya Anda

Gunakan /cost untuk melihat penggunaan sesi saat ini
Pengguna Anthropic Console:
- Periksa penggunaan historis di Anthropic Console (memerlukan peran Admin atau Billing)
- Tetapkan batas pengeluaran workspace untuk workspace Claude Code (memerlukan peran Admin)
Pengguna paket Pro dan Max: Penggunaan termasuk dalam langganan Anda

Mengelola biaya untuk tim

Saat menggunakan Anthropic API, Anda dapat membatasi total pengeluaran workspace Claude Code. Untuk mengonfigurasi, ikuti instruksi ini. Admin dapat melihat laporan biaya dan penggunaan dengan mengikuti instruksi ini.

Di Bedrock dan Vertex, Claude Code tidak mengirim metrik dari cloud Anda. Untuk mendapatkan metrik biaya, beberapa perusahaan besar melaporkan menggunakan LiteLLM, yang merupakan alat open-source yang membantu perusahaan melacak pengeluaran berdasarkan kunci. Proyek ini tidak berafiliasi dengan Anthropic dan kami belum mengaudit keamanannya.

Rekomendasi batas laju

Saat menyiapkan Claude Code untuk tim, pertimbangkan rekomendasi Token Per Menit (TPM) dan Request Per Menit (RPM) per pengguna ini berdasarkan ukuran organisasi Anda:

Ukuran tim	TPM per pengguna	RPM per pengguna
1-5 pengguna	200k-300k	5-7
5-20 pengguna	100k-150k	2.5-3.5
20-50 pengguna	50k-75k	1.25-1.75
50-100 pengguna	25k-35k	0.62-0.87
100-500 pengguna	15k-20k	0.37-0.47
500+ pengguna	10k-15k	0.25-0.35

Misalnya, jika Anda memiliki 200 pengguna, Anda mungkin meminta 20k TPM untuk setiap pengguna, atau 4 juta total TPM (200*20.000 = 4 juta).

TPM per pengguna menurun seiring bertambahnya ukuran tim karena kami mengharapkan lebih sedikit pengguna menggunakan Claude Code secara bersamaan di organisasi yang lebih besar. Batas laju ini berlaku di tingkat organisasi, bukan per pengguna individu, yang berarti pengguna individu dapat sementara mengonsumsi lebih dari bagian yang dihitung mereka ketika yang lain tidak aktif menggunakan layanan.

Jika Anda mengantisipasi skenario dengan penggunaan bersamaan yang sangat tinggi (seperti sesi pelatihan langsung dengan kelompok besar), Anda mungkin memerlukan alokasi TPM yang lebih tinggi per pengguna.

Kurangi penggunaan token

Percakapan kompak:
- Claude menggunakan auto-compact secara default ketika konteks melebihi 95% kapasitas
- Alihkan auto-compact: Jalankan /config dan navigasikan ke “Auto-compact enabled”
- Gunakan /compact secara manual ketika konteks menjadi besar
- Tambahkan instruksi khusus: /compact Focus on code samples and API usage
- Sesuaikan pemadatan dengan menambahkan ke CLAUDE.md:
  # Summary instructions When you are using compact, please focus on test output and code changes
Tulis kueri spesifik: Hindari permintaan yang samar yang memicu pemindaian yang tidak perlu
Pecah tugas kompleks: Bagi tugas besar menjadi interaksi yang terfokus
Bersihkan riwayat antar tugas: Gunakan /clear untuk mereset konteks

Biaya dapat bervariasi secara signifikan berdasarkan:

Ukuran codebase yang dianalisis
Kompleksitas kueri
Jumlah file yang dicari atau dimodifikasi
Panjang riwayat percakapan
Frekuensi pemadatan percakapan
Proses latar belakang (generasi haiku, ringkasan percakapan)

Penggunaan token latar belakang

Claude Code menggunakan token untuk beberapa fungsionalitas latar belakang bahkan saat idle:

Generasi haiku: Pesan kreatif kecil yang muncul saat Anda mengetik (sekitar 1 sen per hari)
Ringkasan percakapan: Pekerjaan latar belakang yang meringkas percakapan sebelumnya untuk fitur claude --resume
Pemrosesan perintah: Beberapa perintah seperti /cost mungkin menghasilkan permintaan untuk memeriksa status

Proses latar belakang ini mengonsumsi sejumlah kecil token (biasanya di bawah $0.04 per sesi) bahkan tanpa interaksi aktif.

Untuk deployment tim, kami merekomendasikan memulai dengan kelompok pilot kecil untuk menetapkan pola penggunaan sebelum rollout yang lebih luas.

Memulai

Bangun dengan Claude Code

Deployment

Administrasi

Konfigurasi

Referensi

Sumber Daya

Kelola biaya secara efektif

Lacak biaya Anda

Mengelola biaya untuk tim

Rekomendasi batas laju

Kurangi penggunaan token

Penggunaan token latar belakang

Memulai

Bangun dengan Claude Code

Deployment

Administrasi

Konfigurasi

Referensi

Sumber Daya

​Lacak biaya Anda

​Mengelola biaya untuk tim

​Rekomendasi batas laju

​Kurangi penggunaan token

​Penggunaan token latar belakang

Lacak biaya Anda

Mengelola biaya untuk tim

Rekomendasi batas laju

Kurangi penggunaan token

Penggunaan token latar belakang