Sie können Claude jetzt zu beliebigem Text, Bildern, Diagrammen und Tabellen in PDFs befragen, die Sie bereitstellen. Einige Beispielanwendungen:

  • Analyse von Finanzberichten und Verständnis von Diagrammen/Tabellen
  • Extraktion wichtiger Informationen aus juristischen Dokumenten
  • Übersetzungshilfe für Dokumente
  • Umwandlung von Dokumentinformationen in strukturierte Formate

Bevor Sie beginnen

PDF-Anforderungen prüfen

Claude arbeitet mit jedem Standard-PDF. Sie sollten jedoch sicherstellen, dass Ihre Anfragegröße diese Anforderungen erfüllt, wenn Sie die PDF-Unterstützung nutzen:

AnforderungLimit
Maximale Anfragegröße32MB
Maximale Seiten pro Anfrage100
FormatStandard-PDF (keine Passwörter/Verschlüsselung)

Bitte beachten Sie, dass beide Limits für die gesamte Anfrage-Payload gelten, einschließlich aller anderen Inhalte, die zusammen mit PDFs gesendet werden.

Da die PDF-Unterstützung auf Claudes Vision-Fähigkeiten basiert, unterliegt sie denselben Einschränkungen und Überlegungen wie andere Vision-Aufgaben.

Unterstützte Plattformen und Modelle

Die PDF-Unterstützung wird derzeit über direkten API-Zugriff und Google Vertex AI unterstützt auf:

  • Claude Opus 4 (claude-opus-4-20250514)
  • Claude Sonnet 4 (claude-sonnet-4-20250514)
  • Claude Sonnet 3.7 (claude-3-7-sonnet-20250219)
  • Claude Sonnet 3.5 Modelle (claude-3-5-sonnet-20241022, claude-3-5-sonnet-20240620)
  • Claude Haiku 3.5 (claude-3-5-haiku-20241022)

Diese Funktionalität wird bald auf Amazon Bedrock unterstützt.


PDFs mit Claude verarbeiten

Senden Sie Ihre erste PDF-Anfrage

Beginnen wir mit einem einfachen Beispiel mit der Messages API. Sie können PDFs auf drei Arten an Claude übermitteln:

  1. Als URL-Referenz zu einem online gehosteten PDF
  2. Als base64-codiertes PDF in document-Inhaltsblöcken
  3. Über eine file_id aus der Files API

Option 1: URL-basiertes PDF-Dokument

Der einfachste Ansatz ist, direkt auf ein PDF über eine URL zu verweisen:

 curl https://api.anthropic.com/v1/messages \
   -H "content-type: application/json" \
   -H "x-api-key: $ANTHROPIC_API_KEY" \
   -H "anthropic-version: 2023-06-01" \
   -d '{
     "model": "claude-opus-4-20250514",
     "max_tokens": 1024,
     "messages": [{
         "role": "user",
         "content": [{
             "type": "document",
             "source": {
                 "type": "url",
                 "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
             }
         },
         {
             "type": "text",
             "text": "What are the key findings in this document?"
         }]
     }]
 }'

Option 2: Base64-codiertes PDF-Dokument

Wenn Sie PDFs von Ihrem lokalen System senden müssen oder wenn keine URL verfügbar ist:

# Method 1: Fetch and encode a remote PDF
curl -s "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf" | base64 | tr -d '\n' > pdf_base64.txt

# Method 2: Encode a local PDF file
# base64 document.pdf | tr -d '\n' > pdf_base64.txt

# Create a JSON request file using the pdf_base64.txt content
jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 1024,
    "messages": [{
        "role": "user",
        "content": [{
            "type": "document",
            "source": {
                "type": "base64",
                "media_type": "application/pdf",
                "data": $PDF_BASE64
            }
        },
        {
            "type": "text",
            "text": "What are the key findings in this document?"
        }]
    }]
}' > request.json

# Send the API request using the JSON file
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Option 3: Files API

Für PDFs, die Sie wiederholt verwenden werden, oder wenn Sie den Kodierungsaufwand vermeiden möchten, verwenden Sie die Files API:

# First, upload your PDF to the Files API
curl -X POST https://api.anthropic.com/v1/files \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -F "file=@document.pdf"

# Then use the returned file_id in your message
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -d '{
    "model": "claude-opus-4-20250514", 
    "max_tokens": 1024,
    "messages": [{
      "role": "user",
      "content": [{
        "type": "document",
        "source": {
          "type": "file",
          "file_id": "file_abc123"
        }
      },
      {
        "type": "text",
        "text": "What are the key findings in this document?"
      }]
    }]
  }'

Wie die PDF-Unterstützung funktioniert

Wenn Sie ein PDF an Claude senden, erfolgen die folgenden Schritte:

1

Das System extrahiert den Inhalt des Dokuments.

  • Das System konvertiert jede Seite des Dokuments in ein Bild.
  • Der Text von jeder Seite wird extrahiert und zusammen mit dem Bild jeder Seite bereitgestellt.
2

Claude analysiert sowohl den Text als auch die Bilder, um das Dokument besser zu verstehen.

  • Dokumente werden als Kombination aus Text und Bildern zur Analyse bereitgestellt.
  • Dies ermöglicht es Benutzern, Einblicke in visuelle Elemente eines PDFs zu erhalten, wie Diagramme, Schaubilder und andere nicht-textliche Inhalte.
3

Claude antwortet und bezieht sich dabei auf die Inhalte des PDFs, falls relevant.

Claude kann sich sowohl auf textliche als auch visuelle Inhalte beziehen, wenn es antwortet. Sie können die Leistung weiter verbessern, indem Sie die PDF-Unterstützung integrieren mit:

  • Prompt-Caching: Um die Leistung bei wiederholter Analyse zu verbessern.
  • Batch-Verarbeitung: Für die Verarbeitung großer Dokumentenmengen.
  • Tool-Nutzung: Um spezifische Informationen aus Dokumenten für die Verwendung als Tool-Eingaben zu extrahieren.

Schätzen Sie Ihre Kosten

Die Token-Anzahl einer PDF-Datei hängt vom gesamten aus dem Dokument extrahierten Text sowie von der Anzahl der Seiten ab:

  • Texttoken-Kosten: Jede Seite verwendet typischerweise 1.500-3.000 Token pro Seite, abhängig von der Inhaltsdichte. Es gelten die Standard-API-Preise ohne zusätzliche PDF-Gebühren.
  • Bildtoken-Kosten: Da jede Seite in ein Bild umgewandelt wird, werden dieselben bildbasierten Kostenberechnungen angewendet.

Sie können Token-Zählung verwenden, um die Kosten für Ihre spezifischen PDFs zu schätzen.


PDF-Verarbeitung optimieren

Leistung verbessern

Befolgen Sie diese Best Practices für optimale Ergebnisse:

  • Platzieren Sie PDFs vor Text in Ihren Anfragen
  • Verwenden Sie Standardschriftarten
  • Stellen Sie sicher, dass Text klar und lesbar ist
  • Drehen Sie Seiten in die richtige aufrechte Ausrichtung
  • Verwenden Sie logische Seitenzahlen (aus dem PDF-Viewer) in Prompts
  • Teilen Sie große PDFs bei Bedarf in Stücke auf
  • Aktivieren Sie Prompt-Caching für wiederholte Analysen

Skalieren Sie Ihre Implementierung

Für die Verarbeitung großer Mengen sollten Sie diese Ansätze in Betracht ziehen:

Verwenden Sie Prompt-Caching

Cachen Sie PDFs, um die Leistung bei wiederholten Abfragen zu verbessern:

# Create a JSON request file using the pdf_base64.txt content
jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 1024,
    "messages": [{
        "role": "user",
        "content": [{
            "type": "document",
            "source": {
                "type": "base64",
                "media_type": "application/pdf",
                "data": $PDF_BASE64
            },
            "cache_control": {
              "type": "ephemeral"
            }
        },
        {
            "type": "text",
            "text": "Which model has the highest human preference win rates across each use-case?"
        }]
    }]
}' > request.json

# Then make the API call using the JSON file
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Verarbeiten Sie Dokument-Batches

Verwenden Sie die Message Batches API für Workflows mit hohem Volumen:

# Create a JSON request file using the pdf_base64.txt content
jq -n --rawfile PDF_BASE64 pdf_base64.txt '
{
  "requests": [
      {
          "custom_id": "my-first-request",
          "params": {
              "model": "claude-opus-4-20250514",
              "max_tokens": 1024,
              "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "document",
                            "source": {
 "type": "base64",
 "media_type": "application/pdf",
 "data": $PDF_BASE64
                            }
                        },
                        {
                            "type": "text",
                            "text": "Which model has the highest human preference win rates across each use-case?"
                        }
                    ]
                }
              ]
          }
      },
      {
          "custom_id": "my-second-request",
          "params": {
              "model": "claude-opus-4-20250514",
              "max_tokens": 1024,
              "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "document",
                            "source": {
 "type": "base64",
 "media_type": "application/pdf",
 "data": $PDF_BASE64
                            }
                        },
                        {
                            "type": "text",
                            "text": "Extract 5 key insights from this document."
                        }
                    ]
                }
              ]
          }
      }
  ]
}
' > request.json

# Then make the API call using the JSON file
curl https://api.anthropic.com/v1/messages/batches \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Nächste Schritte