Sitasi
Claude mampu memberikan sitasi terperinci saat menjawab pertanyaan tentang dokumen, membantu Anda melacak dan memverifikasi sumber informasi dalam respons.
Fitur sitasi saat ini tersedia di Claude 3.7 Sonnet, Claude 3.5 Sonnet (baru) dan 3.5 Haiku.
Silakan bagikan umpan balik dan saran Anda tentang fitur sitasi menggunakan formulir ini.
Berikut contoh cara menggunakan sitasi dengan Messages API:
Perbandingan dengan pendekatan berbasis prompt
Dibandingkan dengan solusi sitasi berbasis prompt, fitur sitasi memiliki keunggulan sebagai berikut:
- Penghematan biaya: Jika pendekatan berbasis prompt Anda meminta Claude untuk menampilkan kutipan langsung, Anda mungkin melihat penghematan biaya karena
cited_text
tidak dihitung sebagai token output Anda. - Keandalan sitasi yang lebih baik: Karena kami mengurai sitasi ke dalam format respons masing-masing yang disebutkan di atas dan mengekstrak
cited_text
, sitasi dijamin berisi penunjuk yang valid ke dokumen yang disediakan. - Peningkatan kualitas sitasi: Dalam evaluasi kami, kami menemukan bahwa fitur sitasi jauh lebih mungkin mengutip kutipan yang paling relevan dari dokumen dibandingkan dengan pendekatan berbasis prompt murni.
Cara kerja sitasi
Integrasikan sitasi dengan Claude dalam langkah-langkah berikut:
Berikan dokumen dan aktifkan sitasi
- Sertakan dokumen dalam salah satu format yang didukung: PDF, teks biasa, atau dokumen konten kustom
- Atur
citations.enabled=true
pada setiap dokumen Anda. Saat ini, sitasi harus diaktifkan pada semua atau tidak ada dokumen dalam permintaan. - Perhatikan bahwa saat ini hanya sitasi teks yang didukung dan sitasi gambar belum dimungkinkan.
Dokumen diproses
- Konten dokumen “dipecah” untuk menentukan granularitas minimum sitasi yang mungkin. Misalnya, pemecahan kalimat akan memungkinkan Claude mengutip satu kalimat atau menggabungkan beberapa kalimat berurutan untuk mengutip sebuah paragraf (atau lebih panjang)!
- Untuk PDF: Teks diekstrak seperti yang dijelaskan dalam Dukungan PDF dan konten dipecah menjadi kalimat. Mengutip gambar dari PDF saat ini tidak didukung.
- Untuk dokumen teks biasa: Konten dipecah menjadi kalimat yang dapat dikutip.
- Untuk dokumen konten kustom: Blok konten yang Anda berikan digunakan apa adanya dan tidak ada pemecahan lebih lanjut yang dilakukan.
Claude memberikan respons yang dikutip
- Respons sekarang dapat mencakup beberapa blok teks di mana setiap blok teks dapat berisi klaim yang dibuat Claude dan daftar sitasi yang mendukung klaim tersebut.
- Sitasi merujuk pada lokasi spesifik dalam dokumen sumber. Format sitasi ini bergantung pada jenis dokumen yang dikutip.
- Untuk PDF: sitasi akan mencakup rentang nomor halaman (indeks-1).
- Untuk dokumen teks biasa: Sitasi akan mencakup rentang indeks karakter (indeks-0).
- Untuk dokumen konten kustom: Sitasi akan mencakup rentang indeks blok konten (indeks-0) yang sesuai dengan daftar konten asli yang disediakan.
- Indeks dokumen disediakan untuk menunjukkan sumber referensi dan diindeks-0 sesuai dengan daftar semua dokumen dalam permintaan asli Anda.
Pemecahan otomatis vs konten kustom
Secara default, dokumen teks biasa dan PDF secara otomatis dipecah menjadi kalimat. Jika Anda membutuhkan kontrol lebih atas granularitas sitasi (misalnya, untuk poin-poin atau transkrip), gunakan dokumen konten kustom sebagai gantinya. Lihat Jenis Dokumen untuk informasi lebih lanjut.
Misalnya, jika Anda ingin Claude dapat mengutip kalimat spesifik dari potongan RAG Anda, Anda harus menempatkan setiap potongan RAG ke dalam dokumen teks biasa. Atau, jika Anda tidak ingin pemecahan lebih lanjut dilakukan, atau jika Anda ingin menyesuaikan pemecahan tambahan, Anda dapat menempatkan potongan RAG ke dalam dokumen konten kustom.
Konten yang dapat dikutip vs tidak dapat dikutip
- Teks yang ditemukan dalam konten
source
dokumen dapat dikutip. title
dancontext
adalah bidang opsional yang akan diteruskan ke model tetapi tidak digunakan untuk konten yang dikutip.title
terbatas dalam panjang sehingga Anda mungkin menemukan bidangcontext
berguna untuk menyimpan metadata dokumen apa pun sebagai teks atau json yang diubah menjadi string.
Indeks sitasi
- Indeks dokumen diindeks-0 dari daftar semua blok konten dokumen dalam permintaan (mencakup semua pesan).
- Indeks karakter diindeks-0 dengan indeks akhir eksklusif.
- Nomor halaman diindeks-1 dengan nomor halaman akhir eksklusif.
- Indeks blok konten diindeks-0 dengan indeks akhir eksklusif dari daftar
content
yang disediakan dalam dokumen konten kustom.
Biaya token
- Mengaktifkan sitasi menyebabkan sedikit peningkatan token input karena penambahan prompt sistem dan pemecahan dokumen.
- Namun, fitur sitasi sangat efisien dengan token output. Di balik layar, model mengeluarkan sitasi dalam format standar yang kemudian diuraikan menjadi teks yang dikutip dan indeks lokasi dokumen. Bidang
cited_text
disediakan untuk kenyamanan dan tidak dihitung sebagai token output. - Ketika diteruskan kembali dalam putaran percakapan berikutnya,
cited_text
juga tidak dihitung sebagai token input.
Kompatibilitas fitur
Sitasi bekerja bersama dengan fitur API lainnya termasuk caching prompt, penghitungan token dan pemrosesan batch.
Jenis Dokumen
Memilih jenis dokumen
Kami mendukung tiga jenis dokumen untuk sitasi:
Jenis | Terbaik untuk | Pemecahan | Format sitasi |
---|---|---|---|
Teks biasa | Dokumen teks sederhana, prosa | Kalimat | Indeks karakter (indeks-0) |
File PDF dengan konten teks | Kalimat | Nomor halaman (indeks-1) | |
Konten kustom | Daftar, transkrip, pemformatan khusus, sitasi yang lebih terperinci | Tidak ada pemecahan tambahan | Indeks blok (indeks-0) |
Dokumen teks biasa
Dokumen teks biasa secara otomatis dipecah menjadi kalimat:
Dokumen PDF
Dokumen PDF disediakan sebagai data yang dikodekan base64. Teks PDF diekstrak dan dipecah menjadi kalimat. Karena sitasi gambar belum didukung, PDF yang merupakan hasil pindaian dokumen dan tidak mengandung teks yang dapat diekstrak tidak akan dapat dikutip.
Dokumen konten kustom
Dokumen konten kustom memberi Anda kontrol atas granularitas sitasi. Tidak ada pemecahan tambahan yang dilakukan dan potongan disediakan ke model sesuai dengan blok konten yang disediakan.
Struktur Respons
Ketika sitasi diaktifkan, respons mencakup beberapa blok teks dengan sitasi:
Dukungan Streaming
Untuk respons streaming, kami telah menambahkan tipe citations_delta
yang berisi satu sitasi yang akan ditambahkan ke daftar citations
pada blok konten text
saat ini.
Was this page helpful?