Claude ist in der Lage, detaillierte Zitierungen bei der Beantwortung von Fragen zu Dokumenten bereitzustellen, was Ihnen hilft, Informationsquellen in Antworten nachzuverfolgen und zu überprüfen.

Die Zitierungsfunktion ist derzeit verfügbar für Claude 3.7 Sonnet, Claude 3.5 Sonnet (neu) und 3.5 Haiku.

Bitte teilen Sie Ihr Feedback und Vorschläge zur Zitierungsfunktion über dieses Formular mit.

Hier ist ein Beispiel, wie Sie Zitierungen mit der Messages API verwenden können:

Vergleich mit Prompt-basierten Ansätzen

Im Vergleich zu Prompt-basierten Zitierungslösungen bietet die Zitierungsfunktion folgende Vorteile:

  • Kosteneinsparungen: Wenn Ihr Prompt-basierter Ansatz Claude auffordert, direkte Zitate auszugeben, können Sie Einsparungen erzielen, da cited_text nicht zu Ihren Ausgabe-Tokens zählt.
  • Bessere Zitierungszuverlässigkeit: Da wir Zitierungen in die jeweiligen Antwortformate umwandeln und cited_text extrahieren, enthalten Zitierungen garantiert gültige Verweise auf die bereitgestellten Dokumente.
  • Verbesserte Zitierungsqualität: In unseren Evaluierungen haben wir festgestellt, dass die Zitierungsfunktion deutlich häufiger die relevantesten Zitate aus Dokumenten zitiert als rein Prompt-basierte Ansätze.

Wie Zitierungen funktionieren

Integrieren Sie Zitierungen mit Claude in diesen Schritten:

1

Dokument(e) bereitstellen und Zitierungen aktivieren

  • Fügen Sie Dokumente in einem der unterstützten Formate ein: PDFs, Nur-Text oder Benutzerdefinierte Inhalte
  • Setzen Sie citations.enabled=true für jedes Ihrer Dokumente. Derzeit müssen Zitierungen für alle oder keines der Dokumente innerhalb einer Anfrage aktiviert werden.
  • Beachten Sie, dass derzeit nur Textzitierungen unterstützt werden und Bildzitierungen noch nicht möglich sind.
2

Dokumente werden verarbeitet

  • Dokumentinhalte werden in “Chunks” unterteilt, um die minimale Granularität möglicher Zitierungen zu definieren. Beispielsweise würde eine Unterteilung in Sätze es Claude ermöglichen, einen einzelnen Satz zu zitieren oder mehrere aufeinanderfolgende Sätze zusammenzufügen, um einen Absatz (oder mehr) zu zitieren!
    • Für PDFs: Text wird wie in PDF-Unterstützung beschrieben extrahiert und der Inhalt wird in Sätze unterteilt. Das Zitieren von Bildern aus PDFs wird derzeit nicht unterstützt.
    • Für Nur-Text-Dokumente: Inhalt wird in Sätze unterteilt, die zitiert werden können.
    • Für Dokumente mit benutzerdefinierten Inhalten: Ihre bereitgestellten Inhaltsblöcke werden unverändert verwendet und es erfolgt keine weitere Unterteilung.
3

Claude liefert eine zitierte Antwort

  • Antworten können nun mehrere Textblöcke enthalten, wobei jeder Textblock eine Behauptung von Claude und eine Liste von Zitierungen enthalten kann, die die Behauptung unterstützen.
  • Zitierungen verweisen auf bestimmte Stellen in Quelldokumenten. Das Format dieser Zitierungen hängt vom Typ des zitierten Dokuments ab.
    • Für PDFs: Zitierungen enthalten den Seitenzahlbereich (beginnend bei 1).
    • Für Nur-Text-Dokumente: Zitierungen enthalten den Zeichenindexbereich (beginnend bei 0).
    • Für Dokumente mit benutzerdefinierten Inhalten: Zitierungen enthalten den Inhaltsblockindexbereich (beginnend bei 0), der der ursprünglich bereitgestellten Inhaltsliste entspricht.
  • Dokumentindizes werden bereitgestellt, um die Referenzquelle anzugeben, und beginnen bei 0 gemäß der Liste aller Dokumente in Ihrer ursprünglichen Anfrage.

Automatische Unterteilung vs. benutzerdefinierte Inhalte

Standardmäßig werden Nur-Text- und PDF-Dokumente automatisch in Sätze unterteilt. Wenn Sie mehr Kontrolle über die Zitierungsgranularität benötigen (z.B. für Aufzählungspunkte oder Transkripte), verwenden Sie stattdessen Dokumente mit benutzerdefinierten Inhalten. Weitere Details finden Sie unter Dokumenttypen.

Wenn Sie beispielsweise möchten, dass Claude bestimmte Sätze aus Ihren RAG-Chunks zitieren kann, sollten Sie jeden RAG-Chunk in ein Nur-Text-Dokument einfügen. Wenn Sie hingegen keine weitere Unterteilung wünschen oder eine zusätzliche Unterteilung anpassen möchten, können Sie RAG-Chunks in Dokument(e) mit benutzerdefinierten Inhalten einfügen.

Zitierbarer vs. nicht-zitierbarer Inhalt

  • Text, der im source-Inhalt eines Dokuments gefunden wird, kann zitiert werden.
  • title und context sind optionale Felder, die an das Modell übergeben werden, aber nicht für zitierten Inhalt verwendet werden.
  • Die Länge von title ist begrenzt, daher kann das context-Feld nützlich sein, um Dokumentmetadaten als Text oder stringifiziertes JSON zu speichern.

Zitierungsindizes

  • Dokumentindizes beginnen bei 0 aus der Liste aller Dokumentinhaltsblöcke in der Anfrage (über alle Nachrichten hinweg).
  • Zeichenindizes beginnen bei 0 mit exklusiven Endindizes.
  • Seitenzahlen beginnen bei 1 mit exklusiven Endseitenzahlen.
  • Inhaltsblockindizes beginnen bei 0 mit exklusiven Endindizes aus der im benutzerdefinierten Inhaltsdokument bereitgestellten content-Liste.

Token-Kosten

  • Die Aktivierung von Zitierungen führt zu einem leichten Anstieg der Eingabe-Tokens aufgrund von Systemprompterweiterungen und Dokumentunterteilung.
  • Die Zitierungsfunktion ist jedoch sehr effizient mit Ausgabe-Tokens. Im Hintergrund gibt das Modell Zitierungen in einem standardisierten Format aus, die dann in zitierten Text und Dokumentpositionsindizes umgewandelt werden. Das Feld cited_text wird zur Vereinfachung bereitgestellt und zählt nicht zu den Ausgabe-Tokens.
  • Wenn es in nachfolgenden Gesprächsrunden zurückgegeben wird, wird cited_text auch nicht zu den Eingabe-Tokens gezählt.

Funktionskompatibilität

Zitierungen funktionieren in Verbindung mit anderen API-Funktionen, einschließlich Prompt-Caching, Token-Zählung und Batch-Verarbeitung.


Dokumenttypen

Auswahl eines Dokumenttyps

Wir unterstützen drei Dokumenttypen für Zitierungen:

TypAm besten geeignet fürUnterteilungZitierungsformat
Nur-TextEinfache Textdokumente, ProsaSatzZeichenindizes (beginnend bei 0)
PDFPDF-Dateien mit TextinhaltSatzSeitenzahlen (beginnend bei 1)
Benutzerdefinierter InhaltListen, Transkripte, spezielle Formatierung, granularere ZitierungenKeine zusätzliche UnterteilungBlockindizes (beginnend bei 0)

Nur-Text-Dokumente

Nur-Text-Dokumente werden automatisch in Sätze unterteilt:

{
    "type": "document",
    "source": {
        "type": "text",
        "media_type": "text/plain",
        "data": "Plain text content..."
    },
    "title": "Document Title", # optional
    "context": "Context about the document that will not be cited from", # optional
    "citations": {"enabled": True}
}

PDF-Dokumente

PDF-Dokumente werden als base64-kodierte Daten bereitgestellt. PDF-Text wird extrahiert und in Sätze unterteilt. Da Bildzitierungen noch nicht unterstützt werden, können PDFs, die Scans von Dokumenten sind und keinen extrahierbaren Text enthalten, nicht zitiert werden.

{
    "type": "document",
    "source": {
        "type": "base64",
        "media_type": "application/pdf",
        "data": base64_encoded_pdf_data
    },
    "title": "Document Title", # optional
    "context": "Context about the document that will not be cited from", # optional
    "citations": {"enabled": True}
}

Dokumente mit benutzerdefinierten Inhalten

Dokumente mit benutzerdefinierten Inhalten geben Ihnen Kontrolle über die Zitierungsgranularität. Es erfolgt keine zusätzliche Unterteilung, und die Chunks werden dem Modell gemäß den bereitgestellten Inhaltsblöcken zur Verfügung gestellt.

{
    "type": "document",
    "source": {
        "type": "content",
        "content": [
            {"type": "text", "text": "First chunk"},
            {"type": "text", "text": "Second chunk"}
        ]
    },
    "title": "Document Title", # optional
    "context": "Context about the document that will not be cited from", # optional
    "citations": {"enabled": True}
}

Antwortstruktur

Wenn Zitierungen aktiviert sind, enthalten Antworten mehrere Textblöcke mit Zitierungen:

{
    "content": [
        {
            "type": "text",
            "text": "According to the document, "
        },
        {
            "type": "text",
            "text": "the grass is green",
            "citations": [{
                "type": "char_location",
                "cited_text": "The grass is green.",
                "document_index": 0,
                "document_title": "Example Document",
                "start_char_index": 0,
                "end_char_index": 20
            }]
        },
        {
            "type": "text",
            "text": " and "
        },
        {
            "type": "text",
            "text": "the sky is blue",
            "citations": [{
                "type": "char_location",
                "cited_text": "The sky is blue.",
                "document_index": 0,
                "document_title": "Example Document",
                "start_char_index": 20,
                "end_char_index": 36
            }]
        }
    ]
}

Streaming-Unterstützung

Für Streaming-Antworten haben wir einen citations_delta-Typ hinzugefügt, der eine einzelne Zitierung enthält, die der citations-Liste des aktuellen text-Inhaltsblocks hinzugefügt werden soll.