Sie können Claude jetzt zu jedem Text, Bildern, Diagrammen und Tabellen in PDFs befragen, die Sie bereitstellen. Einige Beispiel-Anwendungsfälle:

  • Analyse von Finanzberichten und Verstehen von Diagrammen/Tabellen
  • Extraktion wichtiger Informationen aus Rechtsdokumenten
  • Übersetzungshilfe für Dokumente
  • Umwandlung von Dokumentinformationen in strukturierte Formate

Bevor Sie beginnen

PDF-Anforderungen prüfen

Claude funktioniert mit jedem Standard-PDF. Sie sollten jedoch sicherstellen, dass Ihre Anfragegröße diese Anforderungen erfüllt, wenn Sie PDF-Unterstützung verwenden:

AnforderungLimit
Maximale Anfragegröße32MB
Maximale Seiten pro Anfrage100
FormatStandard-PDF (keine Passwörter/Verschlüsselung)

Bitte beachten Sie, dass beide Limits für die gesamte Anfrage-Payload gelten, einschließlich aller anderen Inhalte, die zusammen mit PDFs gesendet werden.

Da die PDF-Unterstützung auf Claudes Vision-Fähigkeiten basiert, unterliegt sie denselben Einschränkungen und Überlegungen wie andere Vision-Aufgaben.

Unterstützte Plattformen und Modelle

PDF-Unterstützung wird derzeit über direkten API-Zugang und Google Vertex AI unterstützt auf:

  • Claude Opus 4 (claude-opus-4-20250514)
  • Claude Sonnet 4 (claude-sonnet-4-20250514)
  • Claude Sonnet 3.7 (claude-3-7-sonnet-20250219)
  • Claude Sonnet 3.5 Modelle (claude-3-5-sonnet-20241022, claude-3-5-sonnet-20240620)
  • Claude Haiku 3.5 (claude-3-5-haiku-20241022)

Diese Funktionalität wird bald auf Amazon Bedrock unterstützt.

Für Nicht-PDF-Dateien wie .csv, .xlsx, .docx, .md oder .txt-Dateien, siehe Arbeiten mit anderen Dateiformaten.


PDFs mit Claude verarbeiten

Senden Sie Ihre erste PDF-Anfrage

Beginnen wir mit einem einfachen Beispiel unter Verwendung der Messages API. Sie können PDFs auf drei Arten an Claude bereitstellen:

  1. Als URL-Referenz zu einem online gehosteten PDF
  2. Als base64-kodiertes PDF in document Content-Blöcken
  3. Über eine file_id aus der Files API

Option 1: URL-basiertes PDF-Dokument

Der einfachste Ansatz ist, ein PDF direkt über eine URL zu referenzieren:

 curl https://api.anthropic.com/v1/messages \
   -H "content-type: application/json" \
   -H "x-api-key: $ANTHROPIC_API_KEY" \
   -H "anthropic-version: 2023-06-01" \
   -d '{
     "model": "claude-opus-4-20250514",
     "max_tokens": 1024,
     "messages": [{
         "role": "user",
         "content": [{
             "type": "document",
             "source": {
                 "type": "url",
                 "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
             }
         },
         {
             "type": "text",
             "text": "Was sind die wichtigsten Erkenntnisse in diesem Dokument?"
         }]
     }]
 }'

Option 2: Base64-kodiertes PDF-Dokument

Wenn Sie PDFs von Ihrem lokalen System senden müssen oder wenn eine URL nicht verfügbar ist:

# Methode 1: Remote-PDF abrufen und kodieren
curl -s "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf" | base64 | tr -d '\n' > pdf_base64.txt

# Methode 2: Lokale PDF-Datei kodieren
# base64 document.pdf | tr -d '\n' > pdf_base64.txt

# JSON-Anfragedatei mit dem pdf_base64.txt-Inhalt erstellen
jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 1024,
    "messages": [{
        "role": "user",
        "content": [{
            "type": "document",
            "source": {
                "type": "base64",
                "media_type": "application/pdf",
                "data": $PDF_BASE64
            }
        },
        {
            "type": "text",
            "text": "Was sind die wichtigsten Erkenntnisse in diesem Dokument?"
        }]
    }]
}' > request.json

# API-Anfrage mit der JSON-Datei senden
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Option 3: Files API

Für PDFs, die Sie wiederholt verwenden werden, oder wenn Sie den Kodierungs-Overhead vermeiden möchten, verwenden Sie die Files API:

# Zuerst Ihr PDF zur Files API hochladen
curl -X POST https://api.anthropic.com/v1/files \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -F "file=@document.pdf"

# Dann die zurückgegebene file_id in Ihrer Nachricht verwenden
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -d '{
    "model": "claude-opus-4-20250514", 
    "max_tokens": 1024,
    "messages": [{
      "role": "user",
      "content": [{
        "type": "document",
        "source": {
          "type": "file",
          "file_id": "file_abc123"
        }
      },
      {
        "type": "text",
        "text": "Was sind die wichtigsten Erkenntnisse in diesem Dokument?"
      }]
    }]
  }'

Wie PDF-Unterstützung funktioniert

Wenn Sie ein PDF an Claude senden, laufen folgende Schritte ab:

1

Das System extrahiert den Inhalt des Dokuments.

  • Das System konvertiert jede Seite des Dokuments in ein Bild.
  • Der Text von jeder Seite wird extrahiert und zusammen mit dem Bild jeder Seite bereitgestellt.
2

Claude analysiert sowohl den Text als auch die Bilder, um das Dokument besser zu verstehen.

  • Dokumente werden als Kombination aus Text und Bildern zur Analyse bereitgestellt.
  • Dies ermöglicht es Benutzern, nach Einblicken in visuelle Elemente eines PDFs zu fragen, wie Diagramme, Schaubilder und andere nicht-textuelle Inhalte.
3

Claude antwortet und referenziert dabei den Inhalt des PDFs, falls relevant.

Claude kann sowohl textuelle als auch visuelle Inhalte referenzieren, wenn es antwortet. Sie können die Leistung weiter verbessern, indem Sie PDF-Unterstützung integrieren mit:

  • Prompt-Caching: Um die Leistung für wiederholte Analysen zu verbessern.
  • Batch-Verarbeitung: Für die Verarbeitung großer Dokumentenmengen.
  • Tool-Verwendung: Um spezifische Informationen aus Dokumenten für die Verwendung als Tool-Eingaben zu extrahieren.

Schätzen Sie Ihre Kosten

Die Token-Anzahl einer PDF-Datei hängt vom gesamten aus dem Dokument extrahierten Text sowie der Anzahl der Seiten ab:

  • Text-Token-Kosten: Jede Seite verwendet typischerweise 1.500-3.000 Token pro Seite, abhängig von der Inhaltsdichte. Standard-API-Preise gelten ohne zusätzliche PDF-Gebühren.
  • Bild-Token-Kosten: Da jede Seite in ein Bild konvertiert wird, werden dieselben bildbasierten Kostenberechnungen angewendet.

Sie können Token-Zählung verwenden, um Kosten für Ihre spezifischen PDFs zu schätzen.


PDF-Verarbeitung optimieren

Leistung verbessern

Befolgen Sie diese bewährten Praktiken für optimale Ergebnisse:

  • Platzieren Sie PDFs vor Text in Ihren Anfragen
  • Verwenden Sie Standard-Schriftarten
  • Stellen Sie sicher, dass Text klar und lesbar ist
  • Drehen Sie Seiten in die richtige aufrechte Ausrichtung
  • Verwenden Sie logische Seitenzahlen (aus PDF-Viewer) in Prompts
  • Teilen Sie große PDFs bei Bedarf in Chunks auf
  • Aktivieren Sie Prompt-Caching für wiederholte Analysen

Skalieren Sie Ihre Implementierung

Für die Verarbeitung großer Mengen sollten Sie diese Ansätze in Betracht ziehen:

Prompt-Caching verwenden

Cachen Sie PDFs, um die Leistung bei wiederholten Abfragen zu verbessern:

# JSON-Anfragedatei mit dem pdf_base64.txt-Inhalt erstellen
jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 1024,
    "messages": [{
        "role": "user",
        "content": [{
            "type": "document",
            "source": {
                "type": "base64",
                "media_type": "application/pdf",
                "data": $PDF_BASE64
            },
            "cache_control": {
              "type": "ephemeral"
            }
        },
        {
            "type": "text",
            "text": "Welches Modell hat die höchsten menschlichen Präferenz-Gewinnraten in jedem Anwendungsfall?"
        }]
    }]
}' > request.json

# Dann den API-Aufruf mit der JSON-Datei durchführen
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Dokument-Batches verarbeiten

Verwenden Sie die Message Batches API für Workflows mit hohem Volumen:

# JSON-Anfragedatei mit dem pdf_base64.txt-Inhalt erstellen
jq -n --rawfile PDF_BASE64 pdf_base64.txt '
{
  "requests": [
      {
          "custom_id": "my-first-request",
          "params": {
              "model": "claude-opus-4-20250514",
              "max_tokens": 1024,
              "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "document",
                            "source": {
 "type": "base64",
 "media_type": "application/pdf",
 "data": $PDF_BASE64
                            }
                        },
                        {
                            "type": "text",
                            "text": "Welches Modell hat die höchsten menschlichen Präferenz-Gewinnraten in jedem Anwendungsfall?"
                        }
                    ]
                }
              ]
          }
      },
      {
          "custom_id": "my-second-request",
          "params": {
              "model": "claude-opus-4-20250514",
              "max_tokens": 1024,
              "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "document",
                            "source": {
 "type": "base64",
 "media_type": "application/pdf",
 "data": $PDF_BASE64
                            }
                        },
                        {
                            "type": "text",
                            "text": "Extrahieren Sie 5 wichtige Erkenntnisse aus diesem Dokument."
                        }
                    ]
                }
              ]
          }
      }
  ]
}
' > request.json

# Dann den API-Aufruf mit der JSON-Datei durchführen
curl https://api.anthropic.com/v1/messages/batches \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Nächste Schritte