Claude mampu memberikan sitasi terperinci saat menjawab pertanyaan tentang dokumen, membantu Anda melacak dan memverifikasi sumber informasi dalam respons.

Fitur sitasi saat ini tersedia di Claude 3.7 Sonnet, Claude 3.5 Sonnet (baru) dan 3.5 Haiku.

Silakan bagikan umpan balik dan saran Anda tentang fitur sitasi menggunakan formulir ini.

Berikut contoh cara menggunakan sitasi dengan Messages API:

Perbandingan dengan pendekatan berbasis prompt

Dibandingkan dengan solusi sitasi berbasis prompt, fitur sitasi memiliki keunggulan sebagai berikut:

  • Penghematan biaya: Jika pendekatan berbasis prompt Anda meminta Claude untuk menampilkan kutipan langsung, Anda mungkin melihat penghematan biaya karena cited_text tidak dihitung sebagai token output Anda.
  • Keandalan sitasi yang lebih baik: Karena kami mengurai sitasi ke dalam format respons masing-masing yang disebutkan di atas dan mengekstrak cited_text, sitasi dijamin berisi penunjuk yang valid ke dokumen yang disediakan.
  • Peningkatan kualitas sitasi: Dalam evaluasi kami, kami menemukan bahwa fitur sitasi jauh lebih mungkin mengutip kutipan yang paling relevan dari dokumen dibandingkan dengan pendekatan berbasis prompt murni.

Cara kerja sitasi

Integrasikan sitasi dengan Claude dalam langkah-langkah berikut:

1

Berikan dokumen dan aktifkan sitasi

  • Sertakan dokumen dalam salah satu format yang didukung: PDF, teks biasa, atau dokumen konten kustom
  • Atur citations.enabled=true pada setiap dokumen Anda. Saat ini, sitasi harus diaktifkan pada semua atau tidak ada dokumen dalam permintaan.
  • Perhatikan bahwa saat ini hanya sitasi teks yang didukung dan sitasi gambar belum dimungkinkan.
2

Dokumen diproses

  • Konten dokumen “dipecah” untuk menentukan granularitas minimum sitasi yang mungkin. Misalnya, pemecahan kalimat akan memungkinkan Claude mengutip satu kalimat atau menggabungkan beberapa kalimat berurutan untuk mengutip sebuah paragraf (atau lebih panjang)!
    • Untuk PDF: Teks diekstrak seperti yang dijelaskan dalam Dukungan PDF dan konten dipecah menjadi kalimat. Mengutip gambar dari PDF saat ini tidak didukung.
    • Untuk dokumen teks biasa: Konten dipecah menjadi kalimat yang dapat dikutip.
    • Untuk dokumen konten kustom: Blok konten yang Anda berikan digunakan apa adanya dan tidak ada pemecahan lebih lanjut yang dilakukan.
3

Claude memberikan respons yang dikutip

  • Respons sekarang dapat mencakup beberapa blok teks di mana setiap blok teks dapat berisi klaim yang dibuat Claude dan daftar sitasi yang mendukung klaim tersebut.
  • Sitasi merujuk pada lokasi spesifik dalam dokumen sumber. Format sitasi ini bergantung pada jenis dokumen yang dikutip.
    • Untuk PDF: sitasi akan mencakup rentang nomor halaman (indeks-1).
    • Untuk dokumen teks biasa: Sitasi akan mencakup rentang indeks karakter (indeks-0).
    • Untuk dokumen konten kustom: Sitasi akan mencakup rentang indeks blok konten (indeks-0) yang sesuai dengan daftar konten asli yang disediakan.
  • Indeks dokumen disediakan untuk menunjukkan sumber referensi dan diindeks-0 sesuai dengan daftar semua dokumen dalam permintaan asli Anda.

Pemecahan otomatis vs konten kustom

Secara default, dokumen teks biasa dan PDF secara otomatis dipecah menjadi kalimat. Jika Anda membutuhkan kontrol lebih atas granularitas sitasi (misalnya, untuk poin-poin atau transkrip), gunakan dokumen konten kustom sebagai gantinya. Lihat Jenis Dokumen untuk informasi lebih lanjut.

Misalnya, jika Anda ingin Claude dapat mengutip kalimat spesifik dari potongan RAG Anda, Anda harus menempatkan setiap potongan RAG ke dalam dokumen teks biasa. Atau, jika Anda tidak ingin pemecahan lebih lanjut dilakukan, atau jika Anda ingin menyesuaikan pemecahan tambahan, Anda dapat menempatkan potongan RAG ke dalam dokumen konten kustom.

Konten yang dapat dikutip vs tidak dapat dikutip

  • Teks yang ditemukan dalam konten source dokumen dapat dikutip.
  • title dan context adalah bidang opsional yang akan diteruskan ke model tetapi tidak digunakan untuk konten yang dikutip.
  • title terbatas dalam panjang sehingga Anda mungkin menemukan bidang context berguna untuk menyimpan metadata dokumen apa pun sebagai teks atau json yang diubah menjadi string.

Indeks sitasi

  • Indeks dokumen diindeks-0 dari daftar semua blok konten dokumen dalam permintaan (mencakup semua pesan).
  • Indeks karakter diindeks-0 dengan indeks akhir eksklusif.
  • Nomor halaman diindeks-1 dengan nomor halaman akhir eksklusif.
  • Indeks blok konten diindeks-0 dengan indeks akhir eksklusif dari daftar content yang disediakan dalam dokumen konten kustom.

Biaya token

  • Mengaktifkan sitasi menyebabkan sedikit peningkatan token input karena penambahan prompt sistem dan pemecahan dokumen.
  • Namun, fitur sitasi sangat efisien dengan token output. Di balik layar, model mengeluarkan sitasi dalam format standar yang kemudian diuraikan menjadi teks yang dikutip dan indeks lokasi dokumen. Bidang cited_text disediakan untuk kenyamanan dan tidak dihitung sebagai token output.
  • Ketika diteruskan kembali dalam putaran percakapan berikutnya, cited_text juga tidak dihitung sebagai token input.

Kompatibilitas fitur

Sitasi bekerja bersama dengan fitur API lainnya termasuk caching prompt, penghitungan token dan pemrosesan batch.


Jenis Dokumen

Memilih jenis dokumen

Kami mendukung tiga jenis dokumen untuk sitasi:

JenisTerbaik untukPemecahanFormat sitasi
Teks biasaDokumen teks sederhana, prosaKalimatIndeks karakter (indeks-0)
PDFFile PDF dengan konten teksKalimatNomor halaman (indeks-1)
Konten kustomDaftar, transkrip, pemformatan khusus, sitasi yang lebih terperinciTidak ada pemecahan tambahanIndeks blok (indeks-0)

Dokumen teks biasa

Dokumen teks biasa secara otomatis dipecah menjadi kalimat:

{
    "type": "document",
    "source": {
        "type": "text",
        "media_type": "text/plain",
        "data": "Konten teks biasa..."
    },
    "title": "Judul Dokumen", # opsional
    "context": "Konteks tentang dokumen yang tidak akan dikutip", # opsional
    "citations": {"enabled": True}
}

Dokumen PDF

Dokumen PDF disediakan sebagai data yang dikodekan base64. Teks PDF diekstrak dan dipecah menjadi kalimat. Karena sitasi gambar belum didukung, PDF yang merupakan hasil pindaian dokumen dan tidak mengandung teks yang dapat diekstrak tidak akan dapat dikutip.

{
    "type": "document",
    "source": {
        "type": "base64",
        "media_type": "application/pdf",
        "data": data_pdf_yang_dikodekan_base64
    },
    "title": "Judul Dokumen", # opsional
    "context": "Konteks tentang dokumen yang tidak akan dikutip", # opsional
    "citations": {"enabled": True}
}

Dokumen konten kustom

Dokumen konten kustom memberi Anda kontrol atas granularitas sitasi. Tidak ada pemecahan tambahan yang dilakukan dan potongan disediakan ke model sesuai dengan blok konten yang disediakan.

{
    "type": "document",
    "source": {
        "type": "content",
        "content": [
            {"type": "text", "text": "Potongan pertama"},
            {"type": "text", "text": "Potongan kedua"}
        ]
    },
    "title": "Judul Dokumen", # opsional
    "context": "Konteks tentang dokumen yang tidak akan dikutip", # opsional
    "citations": {"enabled": True}
}

Struktur Respons

Ketika sitasi diaktifkan, respons mencakup beberapa blok teks dengan sitasi:

{
    "content": [
        {
            "type": "text",
            "text": "Menurut dokumen, "
        },
        {
            "type": "text",
            "text": "rumput berwarna hijau",
            "citations": [{
                "type": "char_location",
                "cited_text": "The grass is green.",
                "document_index": 0,
                "document_title": "Example Document",
                "start_char_index": 0,
                "end_char_index": 20
            }]
        },
        {
            "type": "text",
            "text": " dan "
        },
        {
            "type": "text",
            "text": "langit berwarna biru",
            "citations": [{
                "type": "char_location",
                "cited_text": "The sky is blue.",
                "document_index": 0,
                "document_title": "Example Document",
                "start_char_index": 20,
                "end_char_index": 36
            }]
        }
    ]
}

Dukungan Streaming

Untuk respons streaming, kami telah menambahkan tipe citations_delta yang berisi satu sitasi yang akan ditambahkan ke daftar citations pada blok konten text saat ini.

Was this page helpful?