Harga
Pelajari struktur harga Anthropic untuk model dan fitur
Halaman ini menyediakan informasi harga terperinci untuk model dan fitur Anthropic. Semua harga dalam USD.
Untuk informasi harga terkini, silakan kunjungi anthropic.com/pricing.
Harga model
Tabel berikut menunjukkan harga untuk semua model Claude di berbagai tingkat penggunaan:
Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
---|---|---|---|---|---|
Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
Claude Sonnet 3.7 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
Claude Sonnet 3.5 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Juta token. Kolom “Base Input Tokens” menunjukkan harga input standar, “Cache Writes” dan “Cache Hits” khusus untuk prompt caching, dan “Output Tokens” menunjukkan harga output. Prompt caching menawarkan durasi cache 5 menit (default) dan 1 jam untuk mengoptimalkan biaya untuk berbagai kasus penggunaan.
Tabel di atas mencerminkan pengganda harga berikut untuk prompt caching:
- Token tulis cache 5 menit adalah 1,25 kali harga token input dasar
- Token tulis cache 1 jam adalah 2 kali harga token input dasar
- Token baca cache adalah 0,1 kali harga token input dasar
Harga khusus fitur
Pemrosesan batch
Batch API memungkinkan pemrosesan asinkron dari volume besar permintaan dengan diskon 50% pada token input dan output.
Model | Batch input | Batch output |
---|---|---|
Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.7 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.5 (deprecated) | $1.50 / MTok | $7.50 / MTok |
Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
Untuk informasi lebih lanjut tentang pemrosesan batch, lihat dokumentasi pemrosesan batch kami.
Harga konteks panjang
Saat menggunakan Claude Sonnet 4 dengan jendela konteks 1M token diaktifkan, permintaan yang melebihi 200K token input secara otomatis dikenakan tarif konteks panjang premium:
Jendela konteks 1M token saat ini dalam beta untuk organisasi di tingkat penggunaan 4 dan organisasi dengan batas tarif khusus. Jendela konteks 1M token hanya tersedia untuk Claude Sonnet 4.
≤ 200K token input | > 200K token input |
---|---|
Input: $3 / MTok | Input: $6 / MTok |
Output: $15 / MTok | Output: $22.50 / MTok |
Harga konteks panjang menumpuk dengan pengubah harga lainnya:
- Diskon 50% Batch API berlaku untuk harga konteks panjang
- Pengganda prompt caching berlaku di atas harga konteks panjang
Bahkan dengan flag beta diaktifkan, permintaan dengan kurang dari 200K token input dikenakan tarif standar. Jika permintaan Anda melebihi 200K token input, semua token dikenakan harga premium.
Ambang batas 200K hanya berdasarkan token input (termasuk baca/tulis cache). Jumlah token output tidak mempengaruhi pemilihan tingkat harga, meskipun token output dikenakan tarif yang lebih tinggi ketika ambang batas input terlampaui.
Untuk memeriksa apakah permintaan API Anda dikenakan tarif jendela konteks 1M, periksa objek usage
dalam respons API:
Hitung total token input dengan menjumlahkan:
input_tokens
cache_creation_input_tokens
(jika menggunakan prompt caching)cache_read_input_tokens
(jika menggunakan prompt caching)
Jika total melebihi 200.000 token, seluruh permintaan ditagih dengan tarif konteks 1M.
Untuk informasi lebih lanjut tentang objek usage
, lihat dokumentasi respons API.
Harga penggunaan tool
Tool use requests are priced based on:
- The total number of input tokens sent to the model (including in the
tools
parameter) - The number of output tokens generated
- For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
- The
tools
parameter in API requests (tool names, descriptions, and schemas) tool_use
content blocks in API requests and responsestool_result
content blocks in API requests
When you use tools
, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools
are provided, then a tool choice of none
uses 0 additional system prompt tokens.
Model | Tool choice | Tool use system prompt token count |
---|---|---|
Claude Opus 4.1 | auto , none any , tool | 346 tokens 313 tokens |
Claude Opus 4 | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 4 | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 3.7 | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 3.5 (Oct) (deprecated) | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 3.5 (June) (deprecated) | auto , none any , tool | 294 tokens 261 tokens |
Claude Haiku 3.5 | auto , none any , tool | 264 tokens 340 tokens |
Claude Opus 3 (deprecated) | auto , none any , tool | 530 tokens 281 tokens |
Claude Sonnet 3 | auto , none any , tool | 159 tokens 235 tokens |
Claude Haiku 3 | auto , none any , tool | 264 tokens 340 tokens |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
Untuk harga per model saat ini, lihat bagian harga model di atas.
Untuk informasi lebih lanjut tentang implementasi penggunaan tool dan praktik terbaik, lihat dokumentasi penggunaan tool kami.
Harga tool spesifik
Tool Bash
The bash tool adds 245 input tokens to your API calls.
Additional tokens are consumed by:
- Command outputs (stdout/stderr)
- Error messages
- Large file contents
Lihat harga penggunaan tool untuk detail harga lengkap.
Tool eksekusi kode
The code execution tool usage is tracked separately from token usage. Execution time is a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container.
Pricing: $0.05 per session-hour.
Tool editor teks
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using.
In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
Tool | Additional input tokens |
---|---|
text_editor_20250429 (Claude 4) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7) | 700 tokens |
text_editor_20241022 (Claude Sonnet 3.5 (deprecated)) | 700 tokens |
Lihat harga penggunaan tool untuk detail harga lengkap.
Tool pencarian web
Web search usage is charged in addition to token usage:
Web search is available on the Anthropic API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.
Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.
Tool penggunaan komputer
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
Model | Input tokens per tool definition |
---|---|
Claude 4 / Sonnet 3.7 | 735 tokens |
Claude Sonnet 3.5 (deprecated) | 683 tokens |
Additional token consumption:
- Screenshot images (see Vision pricing)
- Tool execution results returned to Claude
If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Contoh harga kasus penggunaan agen
Memahami harga untuk aplikasi agen sangat penting saat membangun dengan Claude. Contoh dunia nyata ini dapat membantu Anda memperkirakan biaya untuk pola agen yang berbeda.
Contoh agen dukungan pelanggan
Saat membangun agen dukungan pelanggan, berikut cara biaya dapat dipecah:
Contoh perhitungan untuk memproses 10.000 tiket dukungan:
- Rata-rata ~3.700 token per percakapan
- Menggunakan Claude Sonnet 4 pada 15/MTok output
- Total biaya: ~$22.20 per 10.000 tiket
Untuk panduan terperinci dari perhitungan ini, lihat panduan agen dukungan pelanggan kami.
Harga alur kerja agen umum
Untuk arsitektur agen yang lebih kompleks dengan beberapa langkah:
-
Pemrosesan permintaan awal
- Input tipikal: 500-1.000 token
- Biaya pemrosesan: ~$0.003 per permintaan
-
Pengambilan memori dan konteks
- Konteks yang diambil: 2.000-5.000 token
- Biaya per pengambilan: ~$0.015 per operasi
-
Perencanaan dan eksekusi tindakan
- Token perencanaan: 1.000-2.000
- Umpan balik eksekusi: 500-1.000
- Biaya gabungan: ~$0.045 per tindakan
Untuk panduan komprehensif tentang pola harga agen, lihat panduan kasus penggunaan agen kami.
Strategi optimasi biaya
Saat membangun agen dengan Claude:
- Gunakan model yang sesuai: Pilih Haiku untuk tugas sederhana, Sonnet untuk penalaran kompleks
- Implementasikan prompt caching: Kurangi biaya untuk konteks berulang
- Operasi batch: Gunakan Batch API untuk tugas yang tidak sensitif waktu
- Pantau pola penggunaan: Lacak konsumsi token untuk mengidentifikasi peluang optimasi
Untuk aplikasi agen volume tinggi, pertimbangkan untuk menghubungi tim penjualan enterprise kami untuk pengaturan harga khusus.
Pertimbangan harga tambahan
Batas tarif
Batas tarif bervariasi berdasarkan tingkat penggunaan dan mempengaruhi berapa banyak permintaan yang dapat Anda buat:
- Tingkat 1: Penggunaan tingkat pemula dengan batas dasar
- Tingkat 2: Peningkatan batas untuk aplikasi yang berkembang
- Tingkat 3: Batas yang lebih tinggi untuk aplikasi yang mapan
- Tingkat 4: Batas standar maksimum
- Enterprise: Batas khusus tersedia
Untuk informasi batas tarif terperinci, lihat dokumentasi batas tarif kami.
Untuk batas tarif yang lebih tinggi atau pengaturan harga khusus, hubungi tim penjualan kami.
Diskon volume
Diskon volume mungkin tersedia untuk pengguna volume tinggi. Ini dinegosiasikan berdasarkan kasus per kasus.
- Tingkat standar menggunakan harga yang ditunjukkan di atas
- Pelanggan enterprise dapat menghubungi penjualan untuk harga khusus
- Diskon akademik dan penelitian mungkin tersedia
Harga enterprise
Untuk pelanggan enterprise dengan kebutuhan khusus:
- Batas tarif khusus
- Diskon volume
- Dukungan khusus
- Ketentuan khusus
Hubungi tim penjualan kami di sales@anthropic.com atau melalui Anthropic Console untuk membahas opsi harga enterprise.
Penagihan dan pembayaran
- Penagihan dihitung bulanan berdasarkan penggunaan aktual
- Pembayaran diproses dalam USD
- Opsi kartu kredit dan faktur tersedia
- Pelacakan penggunaan tersedia di Anthropic Console
Pertanyaan yang sering diajukan
Bagaimana penggunaan token dihitung?
Token adalah potongan teks yang diproses model. Sebagai perkiraan kasar, 1 token adalah sekitar 4 karakter atau 0,75 kata dalam bahasa Inggris. Jumlah pasti bervariasi berdasarkan bahasa dan jenis konten.
Apakah ada tingkat gratis atau uji coba?
Pengguna baru menerima sejumlah kecil kredit gratis untuk menguji API. Hubungi penjualan untuk informasi tentang uji coba diperpanjang untuk evaluasi enterprise.
Bagaimana diskon menumpuk?
Diskon Batch API dan prompt caching dapat dikombinasikan. Misalnya, menggunakan kedua fitur bersama-sama memberikan penghematan biaya yang signifikan dibandingkan dengan panggilan API standar.
Metode pembayaran apa yang diterima?
Kami menerima kartu kredit utama untuk akun standar. Pelanggan enterprise dapat mengatur faktur dan metode pembayaran lainnya.
Untuk pertanyaan tambahan tentang harga, hubungi support@anthropic.com.