Sie können Claude jetzt zu beliebigem Text, Bildern, Diagrammen und Tabellen in PDFs befragen, die Sie bereitstellen. Einige Beispielanwendungen:

  • Analyse von Finanzberichten und Verständnis von Diagrammen/Tabellen
  • Extraktion wichtiger Informationen aus rechtlichen Dokumenten
  • Übersetzungshilfe für Dokumente
  • Umwandlung von Dokumenteninformationen in strukturierte Formate

Bevor Sie beginnen

PDF-Anforderungen prüfen

Claude arbeitet mit jedem Standard-PDF. Sie sollten jedoch sicherstellen, dass Ihre Anfragegröße diese Anforderungen erfüllt, wenn Sie die PDF-Unterstützung nutzen:

AnforderungLimit
Maximale Anfragegröße32MB
Maximale Seiten pro Anfrage100
FormatStandard-PDF (keine Passwörter/Verschlüsselung)

Bitte beachten Sie, dass beide Limits für die gesamte Anfrage-Payload gelten, einschließlich aller anderen Inhalte, die zusammen mit PDFs gesendet werden.

Da die PDF-Unterstützung auf Claudes Vision-Fähigkeiten basiert, unterliegt sie denselben Einschränkungen und Überlegungen wie andere Vision-Aufgaben.

Unterstützte Plattformen und Modelle

Die PDF-Unterstützung ist derzeit verfügbar für Claude 3.7 Sonnet (claude-3-7-sonnet-20250219), beide Claude 3.5 Sonnet Modelle (claude-3-5-sonnet-20241022, claude-3-5-sonnet-20240620) und Claude 3.5 Haiku (claude-3-5-haiku-20241022) über direkten API-Zugriff und Google Vertex AI. Diese Funktionalität wird bald auch auf Amazon Bedrock unterstützt.


PDFs mit Claude verarbeiten

Senden Sie Ihre erste PDF-Anfrage

Beginnen wir mit einem einfachen Beispiel unter Verwendung der Messages API. Sie können PDFs auf zwei Arten an Claude übermitteln:

  1. Als base64-codiertes PDF in document Content-Blöcken
  2. Als URL-Referenz zu einem online gehosteten PDF

Option 1: URL-basiertes PDF-Dokument

Der einfachste Ansatz ist die direkte Referenzierung eines PDFs über eine URL:

 curl https://api.anthropic.com/v1/messages \
   -H "content-type: application/json" \
   -H "x-api-key: $ANTHROPIC_API_KEY" \
   -H "anthropic-version: 2023-06-01" \
   -d '{
     "model": "claude-3-7-sonnet-20250219",
     "max_tokens": 1024,
     "messages": [{
         "role": "user",
         "content": [{
             "type": "document",
             "source": {
                 "type": "url",
                 "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
             }
         },
         {
             "type": "text",
             "text": "Was sind die wichtigsten Erkenntnisse in diesem Dokument?"
         }]
     }]
 }'

Option 2: Base64-codiertes PDF-Dokument

Wenn Sie PDFs von Ihrem lokalen System senden müssen oder wenn keine URL verfügbar ist:

# Methode 1: Ein Remote-PDF abrufen und codieren
curl -s "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf" | base64 | tr -d '\n' > pdf_base64.txt

# Methode 2: Eine lokale PDF-Datei codieren
# base64 document.pdf | tr -d '\n' > pdf_base64.txt

# Eine JSON-Anfragedatei mit dem Inhalt von pdf_base64.txt erstellen
jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "messages": [{
        "role": "user",
        "content": [{
            "type": "document",
            "source": {
                "type": "base64",
                "media_type": "application/pdf",
                "data": $PDF_BASE64
            }
        },
        {
            "type": "text",
            "text": "Was sind die wichtigsten Erkenntnisse in diesem Dokument?"
        }]
    }]
}' > request.json

# Die API-Anfrage mit der JSON-Datei senden
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Wie die PDF-Unterstützung funktioniert

Wenn Sie ein PDF an Claude senden, laufen folgende Schritte ab:

1

Das System extrahiert den Inhalt des Dokuments.

  • Das System konvertiert jede Seite des Dokuments in ein Bild.
  • Der Text von jeder Seite wird extrahiert und zusammen mit dem Bild der jeweiligen Seite bereitgestellt.
2

Claude analysiert sowohl den Text als auch die Bilder, um das Dokument besser zu verstehen.

  • Dokumente werden als Kombination von Text und Bildern zur Analyse bereitgestellt.
  • Dies ermöglicht es Benutzern, nach Erkenntnissen zu visuellen Elementen eines PDFs zu fragen, wie Diagrammen, Schaubildern und anderen nicht-textlichen Inhalten.
3

Claude antwortet unter Bezugnahme auf die PDF-Inhalte, wenn relevant.

Claude kann sich sowohl auf textliche als auch visuelle Inhalte beziehen, wenn es antwortet. Sie können die Leistung weiter verbessern, indem Sie die PDF-Unterstützung integrieren mit:

  • Prompt-Caching: Zur Verbesserung der Leistung bei wiederholter Analyse.
  • Batch-Verarbeitung: Für die Verarbeitung großer Dokumentenmengen.
  • Tool-Nutzung: Um spezifische Informationen aus Dokumenten für die Verwendung als Tool-Eingaben zu extrahieren.

Schätzen Sie Ihre Kosten

Die Token-Anzahl einer PDF-Datei hängt vom gesamten extrahierten Text sowie der Seitenanzahl ab:

  • Text-Token-Kosten: Jede Seite verwendet typischerweise 1.500-3.000 Token pro Seite, abhängig von der Inhaltsdichte. Es gelten die Standard-API-Preise ohne zusätzliche PDF-Gebühren.
  • Bild-Token-Kosten: Da jede Seite in ein Bild umgewandelt wird, werden dieselben bildbasierten Kostenberechnungen angewendet.

Sie können Token-Zählung verwenden, um die Kosten für Ihre spezifischen PDFs zu schätzen.


PDF-Verarbeitung optimieren

Leistung verbessern

Befolgen Sie diese Best Practices für optimale Ergebnisse:

  • Platzieren Sie PDFs vor Text in Ihren Anfragen
  • Verwenden Sie Standardschriftarten
  • Stellen Sie sicher, dass Text klar und lesbar ist
  • Drehen Sie Seiten in die richtige aufrechte Ausrichtung
  • Verwenden Sie logische Seitenzahlen (aus dem PDF-Viewer) in Prompts
  • Teilen Sie große PDFs bei Bedarf in Chunks auf
  • Aktivieren Sie Prompt-Caching für wiederholte Analysen

Skalieren Sie Ihre Implementierung

Für die Verarbeitung großer Mengen sollten Sie diese Ansätze in Betracht ziehen:

Prompt-Caching verwenden

Cachen Sie PDFs, um die Leistung bei wiederholten Abfragen zu verbessern:

# Eine JSON-Anfragedatei mit dem Inhalt von pdf_base64.txt erstellen
jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "messages": [{
        "role": "user",
        "content": [{
            "type": "document",
            "source": {
                "type": "base64",
                "media_type": "application/pdf",
                "data": $PDF_BASE64
            },
            "cache_control": {
              "type": "ephemeral"
            }
        },
        {
            "type": "text",
            "text": "Welches Modell hat die höchsten Präferenzraten in den jeweiligen Anwendungsfällen?"
        }]
    }]
}' > request.json

# Dann die API-Anfrage mit der JSON-Datei ausführen
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Dokumente im Batch verarbeiten

Verwenden Sie die Message Batches API für Workflows mit hohem Volumen:

# Eine JSON-Anfragedatei mit dem Inhalt von pdf_base64.txt erstellen
jq -n --rawfile PDF_BASE64 pdf_base64.txt '
{
  "requests": [
      {
          "custom_id": "my-first-request",
          "params": {
              "model": "claude-3-7-sonnet-20250219",
              "max_tokens": 1024,
              "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "document",
                            "source": {
 "type": "base64",
 "media_type": "application/pdf",
 "data": $PDF_BASE64
                            }
                        },
                        {
                            "type": "text",
                            "text": "Welches Modell hat die höchsten Präferenzraten in den jeweiligen Anwendungsfällen?"
                        }
                    ]
                }
              ]
          }
      },
      {
          "custom_id": "my-second-request",
          "params": {
              "model": "claude-3-7-sonnet-20250219",
              "max_tokens": 1024,
              "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "document",
                            "source": {
 "type": "base64",
 "media_type": "application/pdf",
 "data": $PDF_BASE64
                            }
                        },
                        {
                            "type": "text",
                            "text": "Extrahieren Sie 5 wichtige Erkenntnisse aus diesem Dokument."
                        }
                    ]
                }
              ]
          }
      }
  ]
}
' > request.json

# Dann die API-Anfrage mit der JSON-Datei ausführen
curl https://api.anthropic.com/v1/messages/batches \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Nächste Schritte

Was this page helpful?