Claude mampu memberikan kutipan terperinci saat menjawab pertanyaan tentang dokumen, membantu Anda melacak dan memverifikasi sumber informasi dalam respons.

Fitur kutipan saat ini tersedia di Claude Opus 4, Claude Sonnet 4, Claude Sonnet 3.7, Claude Sonnet 3.5 (baru) dan Haiku 3.5.

Kutipan dengan Claude Sonnet 3.7

Claude Sonnet 3.7 mungkin kurang cenderung membuat kutipan dibandingkan model Claude lainnya tanpa instruksi yang lebih eksplisit dari pengguna. Saat menggunakan kutipan dengan Claude Sonnet 3.7, kami merekomendasikan untuk menyertakan instruksi tambahan dalam giliran user, seperti "Gunakan kutipan untuk mendukung jawaban Anda." sebagai contoh.

Kami juga mengamati bahwa ketika model diminta untuk menyusun responsnya, model tidak mungkin menggunakan kutipan kecuali secara eksplisit diberitahu untuk menggunakan kutipan dalam format tersebut. Misalnya, jika model diminta untuk menggunakan tag dalam responsnya, Anda harus menambahkan sesuatu seperti “Selalu gunakan kutipan dalam jawaban Anda, bahkan dalam .”

Silakan bagikan umpan balik dan saran Anda tentang fitur kutipan menggunakan formulir ini.

Berikut adalah contoh cara menggunakan kutipan dengan Messages API:

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 1024,
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "document",
            "source": {
              "type": "text",
              "media_type": "text/plain",
              "data": "The grass is green. The sky is blue."
            },
            "title": "My Document",
            "context": "This is a trustworthy document.",
            "citations": {"enabled": true}
          },
          {
            "type": "text",
            "text": "What color is the grass and sky?"
          }
        ]
      }
    ]
  }'

Perbandingan dengan pendekatan berbasis prompt

Dibandingkan dengan solusi kutipan berbasis prompt, fitur kutipan memiliki keunggulan sebagai berikut:

  • Penghematan biaya: Jika pendekatan berbasis prompt Anda meminta Claude untuk mengeluarkan kutipan langsung, Anda mungkin melihat penghematan biaya karena fakta bahwa cited_text tidak dihitung terhadap token output Anda.
  • Keandalan kutipan yang lebih baik: Karena kami mengurai kutipan ke dalam format respons masing-masing yang disebutkan di atas dan mengekstrak cited_text, kutipan dijamin berisi penunjuk yang valid ke dokumen yang disediakan.
  • Kualitas kutipan yang lebih baik: Dalam evaluasi kami, kami menemukan fitur kutipan secara signifikan lebih mungkin mengutip kutipan yang paling relevan dari dokumen dibandingkan dengan pendekatan yang murni berbasis prompt.

Cara kerja kutipan

Integrasikan kutipan dengan Claude dalam langkah-langkah berikut:

1

Berikan dokumen dan aktifkan kutipan

  • Sertakan dokumen dalam format yang didukung: PDF, teks biasa, atau dokumen konten kustom
  • Atur citations.enabled=true pada setiap dokumen Anda. Saat ini, kutipan harus diaktifkan pada semua atau tidak ada dokumen dalam permintaan.
  • Perhatikan bahwa hanya kutipan teks yang saat ini didukung dan kutipan gambar belum memungkinkan.
2

Dokumen diproses

  • Konten dokumen “dipotong” untuk menentukan granularitas minimum dari kutipan yang mungkin. Misalnya, pemotongan kalimat akan memungkinkan Claude mengutip satu kalimat atau merangkai beberapa kalimat berturut-turut untuk mengutip paragraf (atau lebih panjang)!
    • Untuk PDF: Teks diekstrak seperti yang dijelaskan dalam Dukungan PDF dan konten dipotong menjadi kalimat. Mengutip gambar dari PDF saat ini tidak didukung.
    • Untuk dokumen teks biasa: Konten dipotong menjadi kalimat yang dapat dikutip.
    • Untuk dokumen konten kustom: Blok konten yang Anda berikan digunakan apa adanya dan tidak ada pemotongan lebih lanjut yang dilakukan.
3

Claude memberikan respons yang dikutip

  • Respons sekarang dapat mencakup beberapa blok teks di mana setiap blok teks dapat berisi klaim yang dibuat Claude dan daftar kutipan yang mendukung klaim tersebut.
  • Kutipan merujuk lokasi spesifik dalam dokumen sumber. Format kutipan ini bergantung pada jenis dokumen yang dikutip.
    • Untuk PDF: kutipan akan mencakup rentang nomor halaman (1-indexed).
    • Untuk dokumen teks biasa: Kutipan akan mencakup rentang indeks karakter (0-indexed).
    • Untuk dokumen konten kustom: Kutipan akan mencakup rentang indeks blok konten (0-indexed) yang sesuai dengan daftar konten asli yang disediakan.
  • Indeks dokumen disediakan untuk menunjukkan sumber referensi dan 0-indexed sesuai dengan daftar semua dokumen dalam permintaan asli Anda.

Pemotongan otomatis vs konten kustom

Secara default, dokumen teks biasa dan PDF secara otomatis dipotong menjadi kalimat. Jika Anda memerlukan kontrol lebih atas granularitas kutipan (misalnya, untuk poin-poin atau transkrip), gunakan dokumen konten kustom sebagai gantinya. Lihat Jenis Dokumen untuk detail lebih lanjut.

Misalnya, jika Anda ingin Claude dapat mengutip kalimat spesifik dari potongan RAG Anda, Anda harus memasukkan setiap potongan RAG ke dalam dokumen teks biasa. Sebaliknya, jika Anda tidak ingin pemotongan lebih lanjut dilakukan, atau jika Anda ingin menyesuaikan pemotongan tambahan, Anda dapat memasukkan potongan RAG ke dalam dokumen konten kustom.

Konten yang dapat dikutip vs tidak dapat dikutip

  • Teks yang ditemukan dalam konten source dokumen dapat dikutip.
  • title dan context adalah bidang opsional yang akan diteruskan ke model tetapi tidak digunakan untuk konten yang dikutip.
  • title dibatasi panjangnya sehingga Anda mungkin menemukan bidang context berguna untuk menyimpan metadata dokumen apa pun sebagai teks atau json yang distringifikasi.

Indeks kutipan

  • Indeks dokumen adalah 0-indexed dari daftar semua blok konten dokumen dalam permintaan (mencakup semua pesan).
  • Indeks karakter adalah 0-indexed dengan indeks akhir eksklusif.
  • Nomor halaman adalah 1-indexed dengan nomor halaman akhir eksklusif.
  • Indeks blok konten adalah 0-indexed dengan indeks akhir eksklusif dari daftar content yang disediakan dalam dokumen konten kustom.

Biaya token

  • Mengaktifkan kutipan menimbulkan sedikit peningkatan token input karena penambahan prompt sistem dan pemotongan dokumen.
  • Namun, fitur kutipan sangat efisien dengan token output. Di balik layar, model mengeluarkan kutipan dalam format standar yang kemudian diurai menjadi teks yang dikutip dan indeks lokasi dokumen. Bidang cited_text disediakan untuk kemudahan dan tidak dihitung terhadap token output.
  • Ketika diteruskan kembali dalam giliran percakapan berikutnya, cited_text juga tidak dihitung terhadap token input.

Kompatibilitas fitur

Kutipan bekerja bersama dengan fitur API lainnya termasuk prompt caching, token counting dan batch processing.

Menggunakan Prompt Caching dengan Kutipan

Kutipan dan prompt caching dapat digunakan bersama secara efektif.

Blok kutipan yang dihasilkan dalam respons tidak dapat di-cache secara langsung, tetapi dokumen sumber yang mereka rujuk dapat di-cache. Untuk mengoptimalkan kinerja, terapkan cache_control pada blok konten dokumen tingkat atas Anda.

import anthropic

client = anthropic.Anthropic()

# Konten dokumen panjang (misalnya, dokumentasi teknis)
long_document = "This is a very long document with thousands of words..." + " ... " * 1000  # Panjang minimum yang dapat di-cache

response = client.messages.create(
    model="claude-opus-4-20250514",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "text",
                        "media_type": "text/plain",
                        "data": long_document
                    },
                    "citations": {"enabled": True},
                    "cache_control": {"type": "ephemeral"}  # Cache konten dokumen
                },
                {
                    "type": "text",
                    "text": "What does this document say about API features?"
                }
            ]
        }
    ]
)

Dalam contoh ini:

  • Konten dokumen di-cache menggunakan cache_control pada blok dokumen
  • Kutipan diaktifkan pada dokumen
  • Claude dapat menghasilkan respons dengan kutipan sambil mendapat manfaat dari konten dokumen yang di-cache
  • Permintaan berikutnya yang menggunakan dokumen yang sama akan mendapat manfaat dari konten yang di-cache

Jenis Dokumen

Memilih jenis dokumen

Kami mendukung tiga jenis dokumen untuk kutipan. Dokumen dapat disediakan langsung dalam pesan (base64, teks, atau URL) atau diunggah melalui Files API dan dirujuk dengan file_id:

JenisTerbaik untukPemotonganFormat kutipan
Teks biasaDokumen teks sederhana, prosaKalimatIndeks karakter (0-indexed)
PDFFile PDF dengan konten teksKalimatNomor halaman (1-indexed)
Konten kustomDaftar, transkrip, format khusus, kutipan yang lebih granularTidak ada pemotongan tambahanIndeks blok (0-indexed)

File .csv, .xlsx, .docx, .md, dan .txt tidak didukung sebagai blok dokumen. Konversi ini ke teks biasa dan sertakan langsung dalam konten pesan. Lihat Bekerja dengan format file lain.

Dokumen teks biasa

Dokumen teks biasa secara otomatis dipotong menjadi kalimat. Anda dapat menyediakannya secara inline atau dengan referensi dengan file_id mereka:

{
    "type": "document",
    "source": {
        "type": "text",
        "media_type": "text/plain",
        "data": "Plain text content..."
    },
    "title": "Document Title", # opsional
    "context": "Context about the document that will not be cited from", # opsional
    "citations": {"enabled": True}
}

Dokumen PDF

Dokumen PDF dapat disediakan sebagai data yang dikodekan base64 atau dengan file_id. Teks PDF diekstrak dan dipotong menjadi kalimat. Karena kutipan gambar belum didukung, PDF yang merupakan pemindaian dokumen dan tidak berisi teks yang dapat diekstrak tidak akan dapat dikutip.

{
    "type": "document",
    "source": {
        "type": "base64",
        "media_type": "application/pdf",
        "data": base64_encoded_pdf_data
    },
    "title": "Document Title", # opsional
    "context": "Context about the document that will not be cited from", # opsional
    "citations": {"enabled": True}
}

Dokumen konten kustom

Dokumen konten kustom memberi Anda kontrol atas granularitas kutipan. Tidak ada pemotongan tambahan yang dilakukan dan potongan disediakan ke model sesuai dengan blok konten yang disediakan.

{
    "type": "document",
    "source": {
        "type": "content",
        "content": [
            {"type": "text", "text": "First chunk"},
            {"type": "text", "text": "Second chunk"}
        ]
    },
    "title": "Document Title", # opsional
    "context": "Context about the document that will not be cited from", # opsional
    "citations": {"enabled": True}
}

Struktur Respons

Ketika kutipan diaktifkan, respons mencakup beberapa blok teks dengan kutipan:

{
    "content": [
        {
            "type": "text",
            "text": "According to the document, "
        },
        {
            "type": "text",
            "text": "the grass is green",
            "citations": [{
                "type": "char_location",
                "cited_text": "The grass is green.",
                "document_index": 0,
                "document_title": "Example Document",
                "start_char_index": 0,
                "end_char_index": 20
            }]
        },
        {
            "type": "text",
            "text": " and "
        },
        {
            "type": "text",
            "text": "the sky is blue",
            "citations": [{
                "type": "char_location",
                "cited_text": "The sky is blue.",
                "document_index": 0,
                "document_title": "Example Document",
                "start_char_index": 20,
                "end_char_index": 36
            }]
        },
        {
            "type": "text",
            "text": ". Information from page 5 states that ",
        },
        {
            "type": "text",
            "text": "water is essential",
            "citations": [{
                "type": "page_location",
                "cited_text": "Water is essential for life.",
                "document_index": 1,
                "document_title": "PDF Document",
                "start_page_number": 5,
                "end_page_number": 6
            }]
        },
        {
            "type": "text",
            "text": ". The custom document mentions ",
        },
        {
            "type": "text",
            "text": "important findings",
            "citations": [{
                "type": "content_block_location",
                "cited_text": "These are important findings.",
                "document_index": 2,
                "document_title": "Custom Content Document",
                "start_block_index": 0,
                "end_block_index": 1
            }]
        }
    ]
}

Dukungan Streaming

Untuk respons streaming, kami telah menambahkan jenis citations_delta yang berisi satu kutipan untuk ditambahkan ke daftar citations pada blok konten text saat ini.