Sie können Claude jetzt zu beliebigem Text, Bildern, Diagrammen und Tabellen in bereitgestellten PDFs befragen. Einige Beispielanwendungen:

  • Analyse von Finanzberichten und Verständnis von Diagrammen/Tabellen
  • Extraktion wichtiger Informationen aus juristischen Dokumenten
  • Übersetzungsunterstützung für Dokumente
  • Konvertierung von Dokumenteninformationen in strukturierte Formate

Bevor Sie beginnen

PDF-Anforderungen prüfen

Claude arbeitet mit jedem Standard-PDF. Sie sollten jedoch sicherstellen, dass Ihre Anfragegröße diese Anforderungen bei der Verwendung der PDF-Unterstützung erfüllt:

AnforderungLimit
Maximale Anfragegröße32MB
Maximale Seiten pro Anfrage100
FormatStandard-PDF (keine Passwörter/Verschlüsselung)

Bitte beachten Sie, dass beide Limits für die gesamte Anfrage-Payload gelten, einschließlich aller anderen Inhalte, die zusammen mit PDFs gesendet werden.

Da die PDF-Unterstützung auf Claudes Bildverarbeitungsfähigkeiten basiert, unterliegt sie denselben Einschränkungen und Überlegungen wie andere Bildverarbeitungsaufgaben.

Unterstützte Plattformen und Modelle

Die PDF-Unterstützung ist derzeit für beide Claude 3.5 Sonnet Modelle (claude-3-5-sonnet-20241022, claude-3-5-sonnet-20240620) über direkten API-Zugriff verfügbar. Diese Funktionalität wird bald auch auf Amazon Bedrock und Google Vertex AI unterstützt.


PDFs mit Claude verarbeiten

Senden Sie Ihre erste PDF-Anfrage

Beginnen wir mit einem einfachen Beispiel unter Verwendung der Messages API:

Wie die PDF-Unterstützung funktioniert

Wenn Sie ein PDF an Claude senden, erfolgen folgende Schritte:

1

Das System extrahiert den Inhalt des Dokuments.

  • Das System konvertiert jede Seite des Dokuments in ein Bild.
  • Der Text von jeder Seite wird extrahiert und zusammen mit dem Bild der jeweiligen Seite bereitgestellt.
2

Claude analysiert sowohl den Text als auch die Bilder, um das Dokument besser zu verstehen.

  • Dokumente werden als Kombination aus Text und Bildern zur Analyse bereitgestellt.
  • Dies ermöglicht es Benutzern, Einblicke in visuelle Elemente eines PDFs wie Diagramme, Schaubilder und andere nicht-textuelle Inhalte zu erhalten.
3

Claude antwortet unter Bezugnahme auf die PDF-Inhalte, falls relevant.

Claude kann sich sowohl auf textuelle als auch visuelle Inhalte beziehen, wenn es antwortet. Sie können die Leistung weiter verbessern, indem Sie die PDF-Unterstützung integrieren mit:

  • Prompt-Caching: Zur Leistungsverbesserung bei wiederholter Analyse.
  • Batch-Verarbeitung: Für die Verarbeitung großer Dokumentenmengen.
  • Tool-Nutzung: Um spezifische Informationen aus Dokumenten für die Verwendung als Tool-Eingaben zu extrahieren.

Schätzen Sie Ihre Kosten

Die Token-Anzahl einer PDF-Datei hängt von dem gesamten aus dem Dokument extrahierten Text sowie der Seitenanzahl ab:

  • Text-Token-Kosten: Jede Seite verwendet typischerweise 1.500-3.000 Token pro Seite, abhängig von der Inhaltsdichte. Es gelten die Standard-API-Preise ohne zusätzliche PDF-Gebühren.
  • Bild-Token-Kosten: Da jede Seite in ein Bild umgewandelt wird, werden dieselben bildbasierten Kostenberechnungen angewendet.

Sie können Token-Zählung verwenden, um die Kosten für Ihre spezifischen PDFs zu schätzen.


PDF-Verarbeitung optimieren

Leistung verbessern

Befolgen Sie diese Best Practices für optimale Ergebnisse:

  • Platzieren Sie PDFs vor Text in Ihren Anfragen
  • Verwenden Sie Standardschriftarten
  • Stellen Sie sicher, dass Text klar und lesbar ist
  • Drehen Sie Seiten in die richtige aufrechte Ausrichtung
  • Verwenden Sie logische Seitenzahlen (aus dem PDF-Viewer) in Prompts
  • Teilen Sie große PDFs bei Bedarf in Chunks auf
  • Aktivieren Sie Prompt-Caching für wiederholte Analysen

Skalieren Sie Ihre Implementierung

Für die Verarbeitung großer Mengen sollten Sie diese Ansätze in Betracht ziehen:

Prompt-Caching verwenden

Cachen Sie PDFs, um die Leistung bei wiederholten Abfragen zu verbessern:

Dokumenten-Batches verarbeiten

Verwenden Sie die Message Batches API für Workflows mit hohem Volumen:

Nächste Schritte