Harga
Pelajari tentang struktur harga Anthropic untuk model dan fitur
Halaman ini menyediakan informasi harga terperinci untuk model dan fitur Anthropic. Semua harga dalam USD.
Untuk informasi harga terkini, silakan kunjungi anthropic.com/pricing.
Harga model
Tabel berikut menunjukkan harga untuk semua model Claude di berbagai tingkat penggunaan:
Model | Base Input Tokens | Cache Writes | Cache Hits | Output Tokens |
---|---|---|---|---|
Claude 3.7 Sonnet | $3 / MTok | $3.75 / MTok | $0.30 / MTok | $15 / MTok |
Claude 3.5 Sonnet | $3 / MTok | $3.75 / MTok | $0.30 / MTok | $15 / MTok |
Claude 3.5 Haiku | $0.80 / MTok | $1 / MTok | $0.08 / MTok | $4 / MTok |
Claude 3 Opus | $15 / MTok | $18.75 / MTok | $1.50 / MTok | $75 / MTok |
Claude 3 Haiku | $0.25 / MTok | $0.30 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Juta token. Kolom “Base Input Tokens” menunjukkan harga input standar, “Cache Writes” dan “Cache Hits” khusus untuk prompt caching, dan “Output Tokens” menunjukkan harga output.
Harga fitur spesifik
Pemrosesan batch
API Batch memungkinkan pemrosesan asinkron untuk volume permintaan besar dengan diskon 50% untuk token input dan output.
Model | Batch input | Batch output |
---|---|---|
Claude 3.7 Sonnet | $1.50 / MTok | $7.50 / MTok |
Claude 3.5 Sonnet | $1.50 / MTok | $7.50 / MTok |
Claude 3.5 Haiku | $0.40 / MTok | $2 / MTok |
Claude 3 Opus | $7.50 / MTok | $37.50 / MTok |
Claude 3 Haiku | $0.125 / MTok | $0.625 / MTok |
Untuk informasi lebih lanjut tentang pemrosesan batch, lihat dokumentasi pemrosesan batch kami.
Harga penggunaan alat
Tool use requests are priced based on:
- The total number of input tokens sent to the model (including in the
tools
parameter) - The number of output tokens generated
- For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
- The
tools
parameter in API requests (tool names, descriptions, and schemas) tool_use
content blocks in API requests and responsestool_result
content blocks in API requests
When you use tools
, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools
are provided, then a tool choice of none
uses 0 additional system prompt tokens.
Model | Tool choice | Tool use system prompt token count |
---|---|---|
Claude 3.7 Sonnet | auto , none any , tool | 346 tokens 313 tokens |
Claude 3.5 Sonnet (Oct) | auto , none any , tool | 346 tokens 313 tokens |
Claude 3 Opus | auto , none any , tool | 530 tokens 281 tokens |
Claude 3 Sonnet | auto , none any , tool | 159 tokens 235 tokens |
Claude 3 Haiku | auto , none any , tool | 264 tokens 340 tokens |
Claude 3.5 Sonnet (June) | auto , none any , tool | 294 tokens 261 tokens |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
Untuk harga per model terkini, lihat bagian harga model di atas.
Untuk informasi lebih lanjut tentang implementasi penggunaan alat dan praktik terbaik, lihat dokumentasi penggunaan alat kami.
Contoh harga kasus penggunaan agen
Memahami harga untuk aplikasi agen sangat penting saat membangun dengan Claude. Contoh dunia nyata ini dapat membantu Anda memperkirakan biaya untuk pola agen yang berbeda.
Contoh agen layanan pelanggan
Saat membangun agen layanan pelanggan, berikut adalah perkiraan biayanya:
Contoh perhitungan untuk memproses 10.000 tiket dukungan:
- Rata-rata ~3.700 token per percakapan
- Menggunakan Claude 3.7 Sonnet dengan harga 15/MTok output
- Total biaya: ~$22,20 per 10.000 tiket
Untuk penjelasan terperinci tentang perhitungan ini, lihat panduan agen layanan pelanggan kami.
Harga alur kerja agen umum
Untuk arsitektur agen yang lebih kompleks dengan beberapa langkah:
-
Pemrosesan permintaan awal
- Input tipikal: 500-1.000 token
- Biaya pemrosesan: ~$0,003 per permintaan
-
Pengambilan memori dan konteks
- Konteks yang diambil: 2.000-5.000 token
- Biaya per pengambilan: ~$0,015 per operasi
-
Perencanaan dan eksekusi tindakan
- Token perencanaan: 1.000-2.000
- Umpan balik eksekusi: 500-1.000
- Biaya gabungan: ~$0,045 per tindakan
Untuk panduan lengkap tentang pola harga agen, lihat panduan kasus penggunaan agen kami.
Strategi optimasi biaya
Saat membangun agen dengan Claude:
- Gunakan model yang sesuai: Pilih Haiku untuk tugas sederhana, Sonnet untuk penalaran kompleks
- Terapkan prompt caching: Kurangi biaya untuk konteks yang berulang
- Operasi batch: Gunakan API Batch untuk tugas yang tidak sensitif waktu
- Pantau pola penggunaan: Lacak konsumsi token untuk mengidentifikasi peluang optimasi
Untuk aplikasi agen dengan volume tinggi, pertimbangkan untuk menghubungi tim penjualan enterprise kami untuk pengaturan harga khusus.
Pertimbangan harga tambahan
Batas rate
Batas rate bervariasi berdasarkan tingkat penggunaan dan mempengaruhi berapa banyak permintaan yang dapat Anda buat:
- Tier 1: Penggunaan tingkat pemula dengan batas dasar
- Tier 2: Batas yang ditingkatkan untuk aplikasi yang berkembang
- Tier 3: Batas yang lebih tinggi untuk aplikasi yang sudah mapan
- Tier 4: Batas standar maksimum
- Enterprise: Batas khusus tersedia
Untuk informasi batas rate terperinci, lihat dokumentasi batas rate kami.
Diskon volume
Diskon volume mungkin tersedia untuk pengguna dengan volume tinggi. Ini dinegosiasikan berdasarkan kasus per kasus.
- Tier standar menggunakan harga yang ditunjukkan di atas
- Pelanggan enterprise dapat menghubungi sales untuk harga khusus
- Diskon akademik dan penelitian mungkin tersedia
Harga enterprise
Untuk pelanggan enterprise dengan kebutuhan khusus:
- Batas rate khusus
- Diskon volume
- Dukungan khusus
- Ketentuan khusus
Hubungi tim penjualan kami di sales@anthropic.com atau melalui Anthropic Console untuk mendiskusikan opsi harga enterprise.
Penagihan dan pembayaran
- Penagihan dihitung bulanan berdasarkan penggunaan aktual
- Pembayaran diproses dalam USD
- Tersedia opsi kartu kredit dan faktur
- Pelacakan penggunaan tersedia di Anthropic Console
Pertanyaan yang sering diajukan
Bagaimana penggunaan token dihitung?
Token adalah bagian teks yang diproses model. Sebagai perkiraan kasar, 1 token sekitar 4 karakter atau 0,75 kata dalam bahasa Inggris. Jumlah pastinya bervariasi berdasarkan bahasa dan jenis konten.
Apakah ada tier atau uji coba gratis?
Pengguna baru menerima sejumlah kecil kredit gratis untuk menguji API. Hubungi sales untuk informasi tentang uji coba diperpanjang untuk evaluasi enterprise.
Bagaimana diskon ditumpuk?
Diskon API Batch dan prompt caching dapat digabungkan. Misalnya, menggunakan kedua fitur bersama-sama memberikan penghematan biaya yang signifikan dibandingkan dengan panggilan API standar.
Metode pembayaran apa yang diterima?
Kami menerima kartu kredit utama untuk akun standar. Pelanggan enterprise dapat mengatur faktur dan metode pembayaran lainnya.
Untuk pertanyaan tambahan tentang harga, hubungi support@anthropic.com.
Was this page helpful?