Claude Code mengonsumsi token untuk setiap interaksi. Biaya rata-rata adalah 6perpengembangperhari,denganbiayahariantetapdibawah6 per pengembang per hari, dengan biaya harian tetap di bawah 12 untuk 90% pengguna.

Untuk penggunaan tim, Claude Code mengenakan biaya berdasarkan konsumsi token API. Rata-rata, Claude Code menghabiskan biaya ~$100-200/pengembang per bulan dengan Sonnet 4 meskipun ada variasi besar tergantung pada berapa banyak instance yang dijalankan pengguna dan apakah mereka menggunakannya dalam otomatisasi.

Lacak biaya Anda

  • Gunakan /cost untuk melihat penggunaan sesi saat ini
  • Pengguna Anthropic Console:
  • Pengguna paket Pro dan Max: Penggunaan termasuk dalam langganan Anda

Mengelola biaya untuk tim

Saat menggunakan Anthropic API, Anda dapat membatasi total pengeluaran workspace Claude Code. Untuk mengonfigurasi, ikuti instruksi ini. Admin dapat melihat laporan biaya dan penggunaan dengan mengikuti instruksi ini.

Di Bedrock dan Vertex, Claude Code tidak mengirim metrik dari cloud Anda. Untuk mendapatkan metrik biaya, beberapa perusahaan besar melaporkan menggunakan LiteLLM, yang merupakan alat open-source yang membantu perusahaan melacak pengeluaran berdasarkan kunci. Proyek ini tidak berafiliasi dengan Anthropic dan kami belum mengaudit keamanannya.

Rekomendasi batas laju

Saat menyiapkan Claude Code untuk tim, pertimbangkan rekomendasi Token Per Menit (TPM) dan Request Per Menit (RPM) per pengguna ini berdasarkan ukuran organisasi Anda:

Ukuran timTPM per penggunaRPM per pengguna
1-5 pengguna200k-300k5-7
5-20 pengguna100k-150k2.5-3.5
20-50 pengguna50k-75k1.25-1.75
50-100 pengguna25k-35k0.62-0.87
100-500 pengguna15k-20k0.37-0.47
500+ pengguna10k-15k0.25-0.35

Misalnya, jika Anda memiliki 200 pengguna, Anda mungkin meminta 20k TPM untuk setiap pengguna, atau 4 juta total TPM (200*20.000 = 4 juta).

TPM per pengguna menurun seiring bertambahnya ukuran tim karena kami mengharapkan lebih sedikit pengguna menggunakan Claude Code secara bersamaan di organisasi yang lebih besar. Batas laju ini berlaku di tingkat organisasi, bukan per pengguna individu, yang berarti pengguna individu dapat sementara mengonsumsi lebih dari bagian yang dihitung mereka ketika yang lain tidak aktif menggunakan layanan.

Jika Anda mengantisipasi skenario dengan penggunaan bersamaan yang sangat tinggi (seperti sesi pelatihan langsung dengan kelompok besar), Anda mungkin memerlukan alokasi TPM yang lebih tinggi per pengguna.

Kurangi penggunaan token

  • Percakapan kompak:

    • Claude menggunakan auto-compact secara default ketika konteks melebihi 95% kapasitas

    • Alihkan auto-compact: Jalankan /config dan navigasikan ke “Auto-compact enabled”

    • Gunakan /compact secara manual ketika konteks menjadi besar

    • Tambahkan instruksi khusus: /compact Focus on code samples and API usage

    • Sesuaikan pemadatan dengan menambahkan ke CLAUDE.md:

      # Summary instructions
      
      When you are using compact, please focus on test output and code changes
      
  • Tulis kueri spesifik: Hindari permintaan yang samar yang memicu pemindaian yang tidak perlu

  • Pecah tugas kompleks: Bagi tugas besar menjadi interaksi yang terfokus

  • Bersihkan riwayat antar tugas: Gunakan /clear untuk mereset konteks

Biaya dapat bervariasi secara signifikan berdasarkan:

  • Ukuran codebase yang dianalisis
  • Kompleksitas kueri
  • Jumlah file yang dicari atau dimodifikasi
  • Panjang riwayat percakapan
  • Frekuensi pemadatan percakapan
  • Proses latar belakang (generasi haiku, ringkasan percakapan)

Penggunaan token latar belakang

Claude Code menggunakan token untuk beberapa fungsionalitas latar belakang bahkan saat idle:

  • Generasi haiku: Pesan kreatif kecil yang muncul saat Anda mengetik (sekitar 1 sen per hari)
  • Ringkasan percakapan: Pekerjaan latar belakang yang meringkas percakapan sebelumnya untuk fitur claude --resume
  • Pemrosesan perintah: Beberapa perintah seperti /cost mungkin menghasilkan permintaan untuk memeriksa status

Proses latar belakang ini mengonsumsi sejumlah kecil token (biasanya di bawah $0.04 per sesi) bahkan tanpa interaksi aktif.

Untuk deployment tim, kami merekomendasikan memulai dengan kelompok pilot kecil untuk menetapkan pola penggunaan sebelum rollout yang lebih luas.