Halaman ini menyediakan informasi harga terperinci untuk model dan fitur Anthropic. Semua harga dalam USD.

Untuk informasi harga terkini, silakan kunjungi anthropic.com/pricing.

Harga model

Tabel berikut menunjukkan harga untuk semua model Claude di berbagai tingkat penggunaan:

ModelBase Input TokensCache WritesCache HitsOutput Tokens
Claude 3.7 Sonnet$3 / MTok$3.75 / MTok$0.30 / MTok$15 / MTok
Claude 3.5 Sonnet$3 / MTok$3.75 / MTok$0.30 / MTok$15 / MTok
Claude 3.5 Haiku$0.80 / MTok$1 / MTok$0.08 / MTok$4 / MTok
Claude 3 Opus$15 / MTok$18.75 / MTok$1.50 / MTok$75 / MTok
Claude 3 Haiku$0.25 / MTok$0.30 / MTok$0.03 / MTok$1.25 / MTok

MTok = Juta token. Kolom “Base Input Tokens” menunjukkan harga input standar, “Cache Writes” dan “Cache Hits” khusus untuk prompt caching, dan “Output Tokens” menunjukkan harga output.

Harga fitur spesifik

Pemrosesan batch

API Batch memungkinkan pemrosesan asinkron untuk volume permintaan besar dengan diskon 50% untuk token input dan output.

ModelBatch inputBatch output
Claude 3.7 Sonnet$1.50 / MTok$7.50 / MTok
Claude 3.5 Sonnet$1.50 / MTok$7.50 / MTok
Claude 3.5 Haiku$0.40 / MTok$2 / MTok
Claude 3 Opus$7.50 / MTok$37.50 / MTok
Claude 3 Haiku$0.125 / MTok$0.625 / MTok

Untuk informasi lebih lanjut tentang pemrosesan batch, lihat dokumentasi pemrosesan batch kami.

Harga penggunaan alat

Tool use requests are priced based on:

  1. The total number of input tokens sent to the model (including in the tools parameter)
  2. The number of output tokens generated
  3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

The additional tokens from tool use come from:

  • The tools parameter in API requests (tool names, descriptions, and schemas)
  • tool_use content blocks in API requests and responses
  • tool_result content blocks in API requests

When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

ModelTool choiceTool use system prompt token count
Claude 3.7 Sonnetauto, none
any, tool
346 tokens
313 tokens
Claude 3.5 Sonnet (Oct)auto, none
any, tool
346 tokens
313 tokens
Claude 3 Opusauto, none
any, tool
530 tokens
281 tokens
Claude 3 Sonnetauto, none
any, tool
159 tokens
235 tokens
Claude 3 Haikuauto, none
any, tool
264 tokens
340 tokens
Claude 3.5 Sonnet (June)auto, none
any, tool
294 tokens
261 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request.

Untuk harga per model terkini, lihat bagian harga model di atas.

Untuk informasi lebih lanjut tentang implementasi penggunaan alat dan praktik terbaik, lihat dokumentasi penggunaan alat kami.

Contoh harga kasus penggunaan agen

Memahami harga untuk aplikasi agen sangat penting saat membangun dengan Claude. Contoh dunia nyata ini dapat membantu Anda memperkirakan biaya untuk pola agen yang berbeda.

Contoh agen layanan pelanggan

Saat membangun agen layanan pelanggan, berikut adalah perkiraan biayanya:

Contoh perhitungan untuk memproses 10.000 tiket dukungan:

  • Rata-rata ~3.700 token per percakapan
  • Menggunakan Claude 3.7 Sonnet dengan harga 3/MTokinput,3/MTok input, 15/MTok output
  • Total biaya: ~$22,20 per 10.000 tiket

Untuk penjelasan terperinci tentang perhitungan ini, lihat panduan agen layanan pelanggan kami.

Harga alur kerja agen umum

Untuk arsitektur agen yang lebih kompleks dengan beberapa langkah:

  1. Pemrosesan permintaan awal

    • Input tipikal: 500-1.000 token
    • Biaya pemrosesan: ~$0,003 per permintaan
  2. Pengambilan memori dan konteks

    • Konteks yang diambil: 2.000-5.000 token
    • Biaya per pengambilan: ~$0,015 per operasi
  3. Perencanaan dan eksekusi tindakan

    • Token perencanaan: 1.000-2.000
    • Umpan balik eksekusi: 500-1.000
    • Biaya gabungan: ~$0,045 per tindakan

Untuk panduan lengkap tentang pola harga agen, lihat panduan kasus penggunaan agen kami.

Strategi optimasi biaya

Saat membangun agen dengan Claude:

  1. Gunakan model yang sesuai: Pilih Haiku untuk tugas sederhana, Sonnet untuk penalaran kompleks
  2. Terapkan prompt caching: Kurangi biaya untuk konteks yang berulang
  3. Operasi batch: Gunakan API Batch untuk tugas yang tidak sensitif waktu
  4. Pantau pola penggunaan: Lacak konsumsi token untuk mengidentifikasi peluang optimasi

Untuk aplikasi agen dengan volume tinggi, pertimbangkan untuk menghubungi tim penjualan enterprise kami untuk pengaturan harga khusus.

Pertimbangan harga tambahan

Batas rate

Batas rate bervariasi berdasarkan tingkat penggunaan dan mempengaruhi berapa banyak permintaan yang dapat Anda buat:

  • Tier 1: Penggunaan tingkat pemula dengan batas dasar
  • Tier 2: Batas yang ditingkatkan untuk aplikasi yang berkembang
  • Tier 3: Batas yang lebih tinggi untuk aplikasi yang sudah mapan
  • Tier 4: Batas standar maksimum
  • Enterprise: Batas khusus tersedia

Untuk informasi batas rate terperinci, lihat dokumentasi batas rate kami.

Diskon volume

Diskon volume mungkin tersedia untuk pengguna dengan volume tinggi. Ini dinegosiasikan berdasarkan kasus per kasus.

  • Tier standar menggunakan harga yang ditunjukkan di atas
  • Pelanggan enterprise dapat menghubungi sales untuk harga khusus
  • Diskon akademik dan penelitian mungkin tersedia

Harga enterprise

Untuk pelanggan enterprise dengan kebutuhan khusus:

  • Batas rate khusus
  • Diskon volume
  • Dukungan khusus
  • Ketentuan khusus

Hubungi tim penjualan kami di sales@anthropic.com atau melalui Anthropic Console untuk mendiskusikan opsi harga enterprise.

Penagihan dan pembayaran

  • Penagihan dihitung bulanan berdasarkan penggunaan aktual
  • Pembayaran diproses dalam USD
  • Tersedia opsi kartu kredit dan faktur
  • Pelacakan penggunaan tersedia di Anthropic Console

Pertanyaan yang sering diajukan

Bagaimana penggunaan token dihitung?

Token adalah bagian teks yang diproses model. Sebagai perkiraan kasar, 1 token sekitar 4 karakter atau 0,75 kata dalam bahasa Inggris. Jumlah pastinya bervariasi berdasarkan bahasa dan jenis konten.

Apakah ada tier atau uji coba gratis?

Pengguna baru menerima sejumlah kecil kredit gratis untuk menguji API. Hubungi sales untuk informasi tentang uji coba diperpanjang untuk evaluasi enterprise.

Bagaimana diskon ditumpuk?

Diskon API Batch dan prompt caching dapat digabungkan. Misalnya, menggunakan kedua fitur bersama-sama memberikan penghematan biaya yang signifikan dibandingkan dengan panggilan API standar.

Metode pembayaran apa yang diterima?

Kami menerima kartu kredit utama untuk akun standar. Pelanggan enterprise dapat mengatur faktur dan metode pembayaran lainnya.

Untuk pertanyaan tambahan tentang harga, hubungi support@anthropic.com.