Kutipan
Claude mampu memberikan kutipan terperinci saat menjawab pertanyaan tentang dokumen, membantu Anda melacak dan memverifikasi sumber informasi dalam respons.
Claude mampu memberikan kutipan terperinci saat menjawab pertanyaan tentang dokumen, membantu Anda melacak dan memverifikasi sumber informasi dalam respons.
Fitur kutipan saat ini tersedia di Claude Opus 4, Claude Sonnet 4, Claude Sonnet 3.7, Claude Sonnet 3.5 (baru) dan Haiku 3.5.
Kutipan dengan Claude Sonnet 3.7
Claude Sonnet 3.7 mungkin kurang cenderung membuat kutipan dibandingkan model Claude lainnya tanpa instruksi yang lebih eksplisit dari pengguna. Saat menggunakan kutipan dengan Claude Sonnet 3.7, kami merekomendasikan untuk menyertakan instruksi tambahan dalam giliran user
, seperti "Gunakan kutipan untuk mendukung jawaban Anda."
sebagai contoh.
Kami juga mengamati bahwa ketika model diminta untuk menyusun responsnya, model tidak mungkin menggunakan kutipan kecuali secara eksplisit diberitahu untuk menggunakan kutipan dalam format tersebut. Misalnya, jika model diminta untuk menggunakan tag
Silakan bagikan umpan balik dan saran Anda tentang fitur kutipan menggunakan formulir ini.
Berikut adalah contoh cara menggunakan kutipan dengan Messages API:
Perbandingan dengan pendekatan berbasis prompt
Dibandingkan dengan solusi kutipan berbasis prompt, fitur kutipan memiliki keunggulan sebagai berikut:
- Penghematan biaya: Jika pendekatan berbasis prompt Anda meminta Claude untuk mengeluarkan kutipan langsung, Anda mungkin melihat penghematan biaya karena fakta bahwa
cited_text
tidak dihitung terhadap token output Anda. - Keandalan kutipan yang lebih baik: Karena kami mengurai kutipan ke dalam format respons masing-masing yang disebutkan di atas dan mengekstrak
cited_text
, kutipan dijamin berisi penunjuk yang valid ke dokumen yang disediakan. - Kualitas kutipan yang lebih baik: Dalam evaluasi kami, kami menemukan fitur kutipan secara signifikan lebih mungkin mengutip kutipan yang paling relevan dari dokumen dibandingkan dengan pendekatan yang murni berbasis prompt.
Cara kerja kutipan
Integrasikan kutipan dengan Claude dalam langkah-langkah berikut:
Berikan dokumen dan aktifkan kutipan
- Sertakan dokumen dalam format yang didukung: PDF, teks biasa, atau dokumen konten kustom
- Atur
citations.enabled=true
pada setiap dokumen Anda. Saat ini, kutipan harus diaktifkan pada semua atau tidak ada dokumen dalam permintaan. - Perhatikan bahwa hanya kutipan teks yang saat ini didukung dan kutipan gambar belum memungkinkan.
Dokumen diproses
- Konten dokumen “dipotong” untuk menentukan granularitas minimum dari kutipan yang mungkin. Misalnya, pemotongan kalimat akan memungkinkan Claude mengutip satu kalimat atau merangkai beberapa kalimat berturut-turut untuk mengutip paragraf (atau lebih panjang)!
- Untuk PDF: Teks diekstrak seperti yang dijelaskan dalam Dukungan PDF dan konten dipotong menjadi kalimat. Mengutip gambar dari PDF saat ini tidak didukung.
- Untuk dokumen teks biasa: Konten dipotong menjadi kalimat yang dapat dikutip.
- Untuk dokumen konten kustom: Blok konten yang Anda berikan digunakan apa adanya dan tidak ada pemotongan lebih lanjut yang dilakukan.
Claude memberikan respons yang dikutip
- Respons sekarang dapat mencakup beberapa blok teks di mana setiap blok teks dapat berisi klaim yang dibuat Claude dan daftar kutipan yang mendukung klaim tersebut.
- Kutipan merujuk lokasi spesifik dalam dokumen sumber. Format kutipan ini bergantung pada jenis dokumen yang dikutip.
- Untuk PDF: kutipan akan mencakup rentang nomor halaman (1-indexed).
- Untuk dokumen teks biasa: Kutipan akan mencakup rentang indeks karakter (0-indexed).
- Untuk dokumen konten kustom: Kutipan akan mencakup rentang indeks blok konten (0-indexed) yang sesuai dengan daftar konten asli yang disediakan.
- Indeks dokumen disediakan untuk menunjukkan sumber referensi dan 0-indexed sesuai dengan daftar semua dokumen dalam permintaan asli Anda.
Pemotongan otomatis vs konten kustom
Secara default, dokumen teks biasa dan PDF secara otomatis dipotong menjadi kalimat. Jika Anda memerlukan kontrol lebih atas granularitas kutipan (misalnya, untuk poin-poin atau transkrip), gunakan dokumen konten kustom sebagai gantinya. Lihat Jenis Dokumen untuk detail lebih lanjut.
Misalnya, jika Anda ingin Claude dapat mengutip kalimat spesifik dari potongan RAG Anda, Anda harus memasukkan setiap potongan RAG ke dalam dokumen teks biasa. Sebaliknya, jika Anda tidak ingin pemotongan lebih lanjut dilakukan, atau jika Anda ingin menyesuaikan pemotongan tambahan, Anda dapat memasukkan potongan RAG ke dalam dokumen konten kustom.
Konten yang dapat dikutip vs tidak dapat dikutip
- Teks yang ditemukan dalam konten
source
dokumen dapat dikutip. title
dancontext
adalah bidang opsional yang akan diteruskan ke model tetapi tidak digunakan untuk konten yang dikutip.title
dibatasi panjangnya sehingga Anda mungkin menemukan bidangcontext
berguna untuk menyimpan metadata dokumen apa pun sebagai teks atau json yang distringifikasi.
Indeks kutipan
- Indeks dokumen adalah 0-indexed dari daftar semua blok konten dokumen dalam permintaan (mencakup semua pesan).
- Indeks karakter adalah 0-indexed dengan indeks akhir eksklusif.
- Nomor halaman adalah 1-indexed dengan nomor halaman akhir eksklusif.
- Indeks blok konten adalah 0-indexed dengan indeks akhir eksklusif dari daftar
content
yang disediakan dalam dokumen konten kustom.
Biaya token
- Mengaktifkan kutipan menimbulkan sedikit peningkatan token input karena penambahan prompt sistem dan pemotongan dokumen.
- Namun, fitur kutipan sangat efisien dengan token output. Di balik layar, model mengeluarkan kutipan dalam format standar yang kemudian diurai menjadi teks yang dikutip dan indeks lokasi dokumen. Bidang
cited_text
disediakan untuk kemudahan dan tidak dihitung terhadap token output. - Ketika diteruskan kembali dalam giliran percakapan berikutnya,
cited_text
juga tidak dihitung terhadap token input.
Kompatibilitas fitur
Kutipan bekerja bersama dengan fitur API lainnya termasuk prompt caching, token counting dan batch processing.
Menggunakan Prompt Caching dengan Kutipan
Kutipan dan prompt caching dapat digunakan bersama secara efektif.
Blok kutipan yang dihasilkan dalam respons tidak dapat di-cache secara langsung, tetapi dokumen sumber yang mereka rujuk dapat di-cache. Untuk mengoptimalkan kinerja, terapkan cache_control
pada blok konten dokumen tingkat atas Anda.
Dalam contoh ini:
- Konten dokumen di-cache menggunakan
cache_control
pada blok dokumen - Kutipan diaktifkan pada dokumen
- Claude dapat menghasilkan respons dengan kutipan sambil mendapat manfaat dari konten dokumen yang di-cache
- Permintaan berikutnya yang menggunakan dokumen yang sama akan mendapat manfaat dari konten yang di-cache
Jenis Dokumen
Memilih jenis dokumen
Kami mendukung tiga jenis dokumen untuk kutipan. Dokumen dapat disediakan langsung dalam pesan (base64, teks, atau URL) atau diunggah melalui Files API dan dirujuk dengan file_id
:
Jenis | Terbaik untuk | Pemotongan | Format kutipan |
---|---|---|---|
Teks biasa | Dokumen teks sederhana, prosa | Kalimat | Indeks karakter (0-indexed) |
File PDF dengan konten teks | Kalimat | Nomor halaman (1-indexed) | |
Konten kustom | Daftar, transkrip, format khusus, kutipan yang lebih granular | Tidak ada pemotongan tambahan | Indeks blok (0-indexed) |
File .csv, .xlsx, .docx, .md, dan .txt tidak didukung sebagai blok dokumen. Konversi ini ke teks biasa dan sertakan langsung dalam konten pesan. Lihat Bekerja dengan format file lain.
Dokumen teks biasa
Dokumen teks biasa secara otomatis dipotong menjadi kalimat. Anda dapat menyediakannya secara inline atau dengan referensi dengan file_id
mereka:
Dokumen PDF
Dokumen PDF dapat disediakan sebagai data yang dikodekan base64 atau dengan file_id
. Teks PDF diekstrak dan dipotong menjadi kalimat. Karena kutipan gambar belum didukung, PDF yang merupakan pemindaian dokumen dan tidak berisi teks yang dapat diekstrak tidak akan dapat dikutip.
Dokumen konten kustom
Dokumen konten kustom memberi Anda kontrol atas granularitas kutipan. Tidak ada pemotongan tambahan yang dilakukan dan potongan disediakan ke model sesuai dengan blok konten yang disediakan.
Struktur Respons
Ketika kutipan diaktifkan, respons mencakup beberapa blok teks dengan kutipan:
Dukungan Streaming
Untuk respons streaming, kami telah menambahkan jenis citations_delta
yang berisi satu kutipan untuk ditambahkan ke daftar citations
pada blok konten text
saat ini.