Claude ist in der Lage, detaillierte Zitierungen bei der Beantwortung von Fragen zu Dokumenten bereitzustellen und hilft Ihnen dabei, Informationsquellen in Antworten nachzuverfolgen und zu überprüfen.

Die Zitierungsfunktion ist derzeit für Claude 3.7 Sonnet, Claude 3.5 Sonnet (neu) und 3.5 Haiku verfügbar.

Zitierungen mit Claude 3.7 Sonnet

Claude 3.7 Sonnet könnte im Vergleich zu anderen Claude-Modellen weniger häufig Zitierungen vornehmen, wenn keine expliziten Anweisungen vom Benutzer vorliegen. Bei der Verwendung von Zitierungen mit Claude 3.7 Sonnet empfehlen wir, zusätzliche Anweisungen im user-Turn einzufügen, wie zum Beispiel "Verwenden Sie Zitierungen zur Untermauerung Ihrer Antwort.".

Wir haben auch beobachtet, dass das Modell, wenn es aufgefordert wird, seine Antwort zu strukturieren, wahrscheinlich keine Zitierungen verwendet, es sei denn, es wird explizit aufgefordert, Zitierungen innerhalb dieses Formats zu verwenden. Wenn das Modell beispielsweise aufgefordert wird, Tags in seiner Antwort zu verwenden, sollten Sie etwas wie “Verwenden Sie immer Zitierungen in Ihrer Antwort, auch innerhalb von ” hinzufügen.

Bitte teilen Sie uns Ihr Feedback und Ihre Vorschläge zur Zitierungsfunktion über dieses Formular mit.

Hier ist ein Beispiel für die Verwendung von Zitierungen mit der Messages API:

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "document",
            "source": {
              "type": "text",
              "media_type": "text/plain",
              "data": "The grass is green. The sky is blue."
            },
            "title": "My Document",
            "context": "This is a trustworthy document.",
            "citations": {"enabled": true}
          },
          {
            "type": "text",
            "text": "What color is the grass and sky?"
          }
        ]
      }
    ]
  }'

Vergleich mit prompt-basierten Ansätzen

Im Vergleich zu prompt-basierten Zitierungslösungen bietet die Zitierungsfunktion folgende Vorteile:

  • Kosteneinsparungen: Wenn Ihr prompt-basierter Ansatz Claude auffordert, direkte Zitate auszugeben, können Sie Kosteneinsparungen erzielen, da cited_text nicht zu Ihren Ausgabe-Tokens zählt.
  • Bessere Zitierungszuverlässigkeit: Da wir Zitierungen in die jeweiligen Antwortformate parsen und cited_text extrahieren, enthalten Zitierungen garantiert gültige Verweise auf die bereitgestellten Dokumente.
  • Verbesserte Zitierungsqualität: In unseren Evaluierungen haben wir festgestellt, dass die Zitierungsfunktion im Vergleich zu rein prompt-basierten Ansätzen deutlich häufiger die relevantesten Zitate aus Dokumenten zitiert.

Wie Zitierungen funktionieren

Integrieren Sie Zitierungen mit Claude in diesen Schritten:

1

Dokument(e) bereitstellen und Zitierungen aktivieren

  • Fügen Sie Dokumente in einem der unterstützten Formate hinzu: PDFs, Klartext oder benutzerdefinierte Inhalte
  • Setzen Sie citations.enabled=true für jedes Ihrer Dokumente. Derzeit müssen Zitierungen für alle oder keine der Dokumente innerhalb einer Anfrage aktiviert sein.
  • Beachten Sie, dass derzeit nur Textzitierungen unterstützt werden und Bildzitierungen noch nicht möglich sind.
2

Dokumente werden verarbeitet

  • Dokumentinhalte werden in “Chunks” unterteilt, um die minimale Granularität möglicher Zitierungen zu definieren. Zum Beispiel würde eine Satzunterteilung es Claude ermöglichen, einen einzelnen Satz zu zitieren oder mehrere aufeinanderfolgende Sätze zu verketten, um einen Absatz (oder länger) zu zitieren!
    • Für PDFs: Text wird wie in PDF-Unterstützung beschrieben extrahiert und der Inhalt wird in Sätze unterteilt. Das Zitieren von Bildern aus PDFs wird derzeit nicht unterstützt.
    • Für Klartextdokumente: Der Inhalt wird in Sätze unterteilt, die zitiert werden können.
    • Für Dokumente mit benutzerdefinierten Inhalten: Ihre bereitgestellten Inhaltsblöcke werden unverändert verwendet und es erfolgt keine weitere Unterteilung.
3

Claude liefert zitierte Antwort

  • Antworten können nun mehrere Textblöcke enthalten, wobei jeder Textblock eine Aussage von Claude und eine Liste von Zitierungen enthalten kann, die die Aussage unterstützen.
  • Zitierungen verweisen auf bestimmte Stellen in Quelldokumenten. Das Format dieser Zitierungen hängt vom Typ des zitierten Dokuments ab.
    • Für PDFs: Zitierungen enthalten den Seitenbereich (1-indiziert).
    • Für Klartextdokumente: Zitierungen enthalten den Zeichenindexbereich (0-indiziert).
    • Für Dokumente mit benutzerdefinierten Inhalten: Zitierungen enthalten den Inhaltsblockindexbereich (0-indiziert) entsprechend der ursprünglich bereitgestellten Inhaltsliste.
  • Dokumentindizes werden bereitgestellt, um die Referenzquelle anzugeben und sind 0-indiziert gemäß der Liste aller Dokumente in Ihrer ursprünglichen Anfrage.

Automatische Unterteilung vs. benutzerdefinierte Inhalte

Standardmäßig werden Klartext- und PDF-Dokumente automatisch in Sätze unterteilt. Wenn Sie mehr Kontrolle über die Zitierungsgranularität benötigen (z.B. für Aufzählungspunkte oder Transkripte), verwenden Sie stattdessen Dokumente mit benutzerdefinierten Inhalten. Weitere Details finden Sie unter Dokumenttypen.

Wenn Sie zum Beispiel möchten, dass Claude bestimmte Sätze aus Ihren RAG-Chunks zitieren kann, sollten Sie jeden RAG-Chunk in ein Klartextdokument einfügen. Wenn Sie keine weitere Unterteilung wünschen oder wenn Sie zusätzliche Unterteilungen anpassen möchten, können Sie RAG-Chunks in Dokument(e) mit benutzerdefinierten Inhalten einfügen.

Zitierbarer vs. nicht-zitierbarer Inhalt

  • Text, der sich im source-Inhalt eines Dokuments befindet, kann zitiert werden.
  • title und context sind optionale Felder, die an das Modell übergeben werden, aber nicht für zitierten Inhalt verwendet werden.
  • title ist in der Länge begrenzt, daher kann das context-Feld nützlich sein, um Dokumentmetadaten als Text oder stringifiziertes JSON zu speichern.

Zitierungsindizes

  • Dokumentindizes sind 0-indiziert aus der Liste aller Dokumentinhaltsblöcke in der Anfrage (über alle Nachrichten hinweg).
  • Zeichenindizes sind 0-indiziert mit exklusiven Endindizes.
  • Seitenzahlen sind 1-indiziert mit exklusiven Endseitenzahlen.
  • Inhaltsblockindizes sind 0-indiziert mit exklusiven Endindizes aus der im benutzerdefinierten Inhaltsdokument bereitgestellten content-Liste.

Token-Kosten

  • Die Aktivierung von Zitierungen führt zu einem leichten Anstieg der Eingabe-Token aufgrund von Systemprompt-Ergänzungen und Dokumentunterteilung.
  • Die Zitierungsfunktion ist jedoch sehr effizient mit Ausgabe-Token. Unter der Haube gibt das Modell Zitierungen in einem standardisierten Format aus, die dann in zitierten Text und Dokumentpositionsindizes geparst werden. Das cited_text-Feld wird zur Bequemlichkeit bereitgestellt und zählt nicht zu den Ausgabe-Token.
  • Wenn es in nachfolgenden Gesprächsrunden zurückgegeben wird, wird cited_text auch nicht zu den Eingabe-Token gezählt.

Funktionskompatibilität

Zitierungen funktionieren in Verbindung mit anderen API-Funktionen einschließlich Prompt-Caching, Token-Zählung und Batch-Verarbeitung.


Dokumenttypen

Auswahl eines Dokumenttyps

Wir unterstützen drei Dokumenttypen für Zitierungen:

TypAm besten geeignet fürUnterteilungZitierungsformat
KlartextEinfache Textdokumente, ProsaSatzZeichenindizes (0-indiziert)
PDFPDF-Dateien mit TextinhaltSatzSeitenzahlen (1-indiziert)
Benutzerdefinierte InhalteListen, Transkripte, spezielle Formatierung, feinere ZitierungenKeine zusätzliche UnterteilungBlockindizes (0-indiziert)

Klartextdokumente

Klartextdokumente werden automatisch in Sätze unterteilt:

{
    "type": "document",
    "source": {
        "type": "text",
        "media_type": "text/plain",
        "data": "Klartextinhalt..."
    },
    "title": "Dokumenttitel", # optional
    "context": "Kontext über das Dokument, aus dem nicht zitiert wird", # optional
    "citations": {"enabled": True}
}

PDF-Dokumente

PDF-Dokumente werden als base64-kodierte Daten bereitgestellt. PDF-Text wird extrahiert und in Sätze unterteilt. Da Bildzitierungen noch nicht unterstützt werden, können PDFs, die Scans von Dokumenten sind und keinen extrahierbaren Text enthalten, nicht zitiert werden.

{
    "type": "document",
    "source": {
        "type": "base64",
        "media_type": "application/pdf",
        "data": base64_encoded_pdf_data
    },
    "title": "Dokumenttitel", # optional
    "context": "Kontext über das Dokument, aus dem nicht zitiert wird", # optional
    "citations": {"enabled": True}
}

Dokumente mit benutzerdefinierten Inhalten

Dokumente mit benutzerdefinierten Inhalten geben Ihnen Kontrolle über die Zitierungsgranularität. Es erfolgt keine zusätzliche Unterteilung und Chunks werden dem Modell entsprechend den bereitgestellten Inhaltsblöcken zur Verfügung gestellt.

{
    "type": "document",
    "source": {
        "type": "content",
        "content": [
            {"type": "text", "text": "Erster Chunk"},
            {"type": "text", "text": "Zweiter Chunk"}
        ]
    },
    "title": "Dokumenttitel", # optional
    "context": "Kontext über das Dokument, aus dem nicht zitiert wird", # optional
    "citations": {"enabled": True}
}

Antwortstruktur

Wenn Zitierungen aktiviert sind, enthalten Antworten mehrere Textblöcke mit Zitierungen:

{
    "content": [
        {
            "type": "text",
            "text": "Laut dem Dokument "
        },
        {
            "type": "text",
            "text": "ist das Gras grün",
            "citations": [{
                "type": "char_location",
                "cited_text": "The grass is green.",
                "document_index": 0,
                "document_title": "Example Document",
                "start_char_index": 0,
                "end_char_index": 20
            }]
        },
        {
            "type": "text",
            "text": " und "
        },
        {
            "type": "text",
            "text": "der Himmel ist blau",
            "citations": [{
                "type": "char_location",
                "cited_text": "The sky is blue.",
                "document_index": 0,
                "document_title": "Example Document",
                "start_char_index": 20,
                "end_char_index": 36
            }]
        }
    ]
}

Streaming-Unterstützung

Für Streaming-Antworten haben wir einen citations_delta-Typ hinzugefügt, der eine einzelne Zitierung enthält, die der citations-Liste des aktuellen text-Inhaltsblocks hinzugefügt werden soll.