API Penggunaan dan Biaya
Akses data penggunaan dan biaya API organisasi Anda secara programatis dengan API Admin Penggunaan & Biaya.
The Admin API is unavailable for individual accounts. To collaborate with teammates and add members, set up your organization in Console → Settings → Organization.
API Admin Penggunaan & Biaya menyediakan akses programatis dan granular ke data penggunaan dan biaya API historis untuk organisasi Anda. Data ini mirip dengan informasi yang tersedia di halaman Penggunaan dan Biaya dari Konsol Anthropic.
API ini memungkinkan Anda untuk memantau, menganalisis, dan mengoptimalkan implementasi Claude dengan lebih baik:
- Pelacakan Penggunaan yang Akurat: Dapatkan jumlah token yang tepat dan pola penggunaan alih-alih hanya mengandalkan penghitungan token respons
- Rekonsiliasi Biaya: Cocokkan catatan internal dengan penagihan Anthropic untuk tim keuangan dan akuntansi
- Kinerja dan peningkatan produk: Pantau kinerja produk sambil mengukur apakah perubahan pada sistem telah meningkatkannya, atau siapkan peringatan
- Optimisasi batas laju dan Tingkat Prioritas: Optimalkan fitur seperti prompt caching atau prompt spesifik untuk memanfaatkan kapasitas yang dialokasikan secara maksimal, atau beli kapasitas khusus.
- Analisis Lanjutan: Lakukan analisis data yang lebih mendalam daripada yang tersedia di Konsol
Kunci API Admin diperlukan
API ini adalah bagian dari API Admin. Endpoint ini memerlukan kunci API Admin (dimulai dengan sk-ant-admin...
) yang berbeda dari kunci API standar. Hanya anggota organisasi dengan peran admin yang dapat menyediakan kunci API Admin melalui Konsol Anthropic.
Solusi mitra
Platform observabilitas terkemuka menawarkan integrasi siap pakai untuk memantau penggunaan dan biaya API Claude Anda, tanpa menulis kode khusus. Integrasi ini menyediakan dashboard, peringatan, dan analitik untuk membantu Anda mengelola penggunaan API secara efektif.
Datadog
Observabilitas LLM dengan pelacakan dan pemantauan otomatis
Grafana Cloud
Integrasi tanpa agen untuk observabilitas LLM yang mudah dengan dashboard dan peringatan siap pakai
Honeycomb
Kueri dan visualisasi lanjutan melalui OpenTelemetry
Mulai cepat
Dapatkan penggunaan harian organisasi Anda untuk 7 hari terakhir:
Atur header User-Agent untuk integrasi
Jika Anda membangun integrasi, atur header User-Agent Anda untuk membantu kami memahami pola penggunaan:
API Penggunaan
Lacak konsumsi token di seluruh organisasi Anda dengan rincian detail berdasarkan model, ruang kerja, dan tingkat layanan dengan endpoint /v1/organizations/usage_report/messages
.
Konsep kunci
- Bucket waktu: Agregat data penggunaan dalam interval tetap (
1m
,1h
, atau1d
) - Pelacakan token: Ukur input tidak di-cache, input di-cache, pembuatan cache, dan token output
- Penyaringan & pengelompokan: Saring berdasarkan kunci API, ruang kerja, model, tingkat layanan, atau jendela konteks, dan kelompokkan hasil berdasarkan dimensi ini
- Penggunaan alat server: Lacak penggunaan alat sisi server seperti pencarian web
Untuk detail parameter lengkap dan skema respons, lihat referensi API Penggunaan.
Contoh dasar
Penggunaan harian berdasarkan model
Penggunaan per jam dengan penyaringan
Batas granularitas waktu
Granularitas | Batas Default | Batas Maksimum | Kasus Penggunaan |
---|---|---|---|
1m | 60 bucket | 1440 bucket | Pemantauan real-time |
1h | 24 bucket | 168 bucket | Pola harian |
1d | 7 bucket | 31 bucket | Laporan mingguan/bulanan |
API Biaya
Ambil rincian biaya tingkat layanan dalam USD dengan endpoint /v1/organizations/cost_report
.
Konsep kunci
- Mata uang: Semua biaya dalam USD, dilaporkan sebagai string desimal dalam unit terkecil (sen)
- Jenis biaya: Lacak biaya penggunaan token, pencarian web, dan eksekusi kode
- Pengelompokan: Kelompokkan biaya berdasarkan ruang kerja atau deskripsi untuk rincian detail
- Bucket waktu: Hanya granularitas harian (
1d
)
Untuk detail parameter lengkap dan skema respons, lihat referensi API Biaya.
Biaya Tingkat Prioritas menggunakan model penagihan yang berbeda dan tidak termasuk dalam endpoint biaya. Lacak penggunaan Tingkat Prioritas melalui endpoint penggunaan sebagai gantinya.
Contoh dasar
Paginasi
Kedua endpoint mendukung paginasi untuk dataset besar:
- Buat permintaan awal Anda
- Jika
has_more
adalahtrue
, gunakan nilainext_page
dalam permintaan berikutnya - Lanjutkan sampai
has_more
adalahfalse
Kasus penggunaan umum
Jelajahi implementasi detail di anthropic-cookbook:
- Laporan penggunaan harian: Lacak tren konsumsi token
- Atribusi biaya: Alokasikan pengeluaran berdasarkan ruang kerja untuk chargeback
- Efisiensi cache: Ukur dan optimalkan prompt caching
- Pemantauan anggaran: Siapkan peringatan untuk ambang batas pengeluaran
- Ekspor CSV: Buat laporan untuk tim keuangan
Pertanyaan yang sering diajukan
Seberapa segar datanya?
Data penggunaan dan biaya biasanya muncul dalam 5 menit setelah penyelesaian permintaan API, meskipun penundaan kadang-kadang bisa lebih lama.
Berapa frekuensi polling yang direkomendasikan?
API mendukung polling sekali per menit untuk penggunaan berkelanjutan. Untuk burst singkat (misalnya, mengunduh data yang dipaginasi), polling yang lebih sering dapat diterima. Cache hasil untuk dashboard yang memerlukan pembaruan sering.
Bagaimana cara melacak penggunaan eksekusi kode?
Biaya eksekusi kode muncul di endpoint biaya yang dikelompokkan di bawah Code Execution Usage
di bidang deskripsi. Eksekusi kode tidak termasuk dalam endpoint penggunaan.
Bagaimana cara melacak penggunaan Tingkat Prioritas?
Saring atau kelompokkan berdasarkan service_tier
di endpoint penggunaan dan cari nilai priority
. Biaya Tingkat Prioritas tidak tersedia di endpoint biaya.
Apa yang terjadi dengan penggunaan Workbench?
Penggunaan API dari Workbench tidak terkait dengan kunci API, jadi api_key_id
akan menjadi null
bahkan saat mengelompokkan berdasarkan dimensi tersebut.
Bagaimana ruang kerja default direpresentasikan?
Penggunaan dan biaya yang dikaitkan dengan ruang kerja default memiliki nilai null
untuk workspace_id
.
Lihat juga
API Penggunaan dan Biaya dapat digunakan untuk membantu Anda memberikan pengalaman yang lebih baik bagi pengguna Anda, membantu Anda mengelola biaya, dan mempertahankan batas laju Anda. Pelajari lebih lanjut tentang beberapa fitur lain ini:
- Ikhtisar API Admin
- Referensi API Admin
- Harga
- Prompt caching - Optimalkan biaya dengan caching
- Pemrosesan batch - Diskon 50% untuk permintaan batch
- Batas laju - Pahami tingkat penggunaan