PDF-Unterstützung
Verarbeiten Sie PDFs mit Claude 3.5 Sonnet. Extrahieren Sie Text, analysieren Sie Diagramme und verstehen Sie visuelle Inhalte aus Ihren Dokumenten.
Sie können Claude jetzt zu beliebigem Text, Bildern, Diagrammen und Tabellen in bereitgestellten PDFs befragen. Einige Beispielanwendungen:
- Analyse von Finanzberichten und Verständnis von Diagrammen/Tabellen
- Extraktion wichtiger Informationen aus juristischen Dokumenten
- Übersetzungsunterstützung für Dokumente
- Konvertierung von Dokumenteninformationen in strukturierte Formate
Bevor Sie beginnen
PDF-Anforderungen prüfen
Claude arbeitet mit jedem Standard-PDF. Sie sollten jedoch sicherstellen, dass Ihre Anfragegröße diese Anforderungen bei der Verwendung der PDF-Unterstützung erfüllt:
Anforderung | Limit |
---|---|
Maximale Anfragegröße | 32MB |
Maximale Seiten pro Anfrage | 100 |
Format | Standard-PDF (keine Passwörter/Verschlüsselung) |
Bitte beachten Sie, dass beide Limits für die gesamte Anfrage-Payload gelten, einschließlich aller anderen Inhalte, die zusammen mit PDFs gesendet werden.
Da die PDF-Unterstützung auf Claudes Bildverarbeitungsfähigkeiten basiert, unterliegt sie denselben Einschränkungen und Überlegungen wie andere Bildverarbeitungsaufgaben.
Unterstützte Plattformen und Modelle
Die PDF-Unterstützung ist derzeit für beide Claude 3.5 Sonnet Modelle (claude-3-5-sonnet-20241022
, claude-3-5-sonnet-20240620
) über direkten API-Zugriff verfügbar. Diese Funktionalität wird bald auch auf Amazon Bedrock und Google Vertex AI unterstützt.
PDFs mit Claude verarbeiten
Senden Sie Ihre erste PDF-Anfrage
Beginnen wir mit einem einfachen Beispiel unter Verwendung der Messages API:
Wie die PDF-Unterstützung funktioniert
Wenn Sie ein PDF an Claude senden, erfolgen folgende Schritte:
Das System extrahiert den Inhalt des Dokuments.
- Das System konvertiert jede Seite des Dokuments in ein Bild.
- Der Text von jeder Seite wird extrahiert und zusammen mit dem Bild der jeweiligen Seite bereitgestellt.
Claude analysiert sowohl den Text als auch die Bilder, um das Dokument besser zu verstehen.
- Dokumente werden als Kombination aus Text und Bildern zur Analyse bereitgestellt.
- Dies ermöglicht es Benutzern, Einblicke in visuelle Elemente eines PDFs wie Diagramme, Schaubilder und andere nicht-textuelle Inhalte zu erhalten.
Claude antwortet unter Bezugnahme auf die PDF-Inhalte, falls relevant.
Claude kann sich sowohl auf textuelle als auch visuelle Inhalte beziehen, wenn es antwortet. Sie können die Leistung weiter verbessern, indem Sie die PDF-Unterstützung integrieren mit:
- Prompt-Caching: Zur Leistungsverbesserung bei wiederholter Analyse.
- Batch-Verarbeitung: Für die Verarbeitung großer Dokumentenmengen.
- Tool-Nutzung: Um spezifische Informationen aus Dokumenten für die Verwendung als Tool-Eingaben zu extrahieren.
Schätzen Sie Ihre Kosten
Die Token-Anzahl einer PDF-Datei hängt von dem gesamten aus dem Dokument extrahierten Text sowie der Seitenanzahl ab:
- Text-Token-Kosten: Jede Seite verwendet typischerweise 1.500-3.000 Token pro Seite, abhängig von der Inhaltsdichte. Es gelten die Standard-API-Preise ohne zusätzliche PDF-Gebühren.
- Bild-Token-Kosten: Da jede Seite in ein Bild umgewandelt wird, werden dieselben bildbasierten Kostenberechnungen angewendet.
Sie können Token-Zählung verwenden, um die Kosten für Ihre spezifischen PDFs zu schätzen.
PDF-Verarbeitung optimieren
Leistung verbessern
Befolgen Sie diese Best Practices für optimale Ergebnisse:
- Platzieren Sie PDFs vor Text in Ihren Anfragen
- Verwenden Sie Standardschriftarten
- Stellen Sie sicher, dass Text klar und lesbar ist
- Drehen Sie Seiten in die richtige aufrechte Ausrichtung
- Verwenden Sie logische Seitenzahlen (aus dem PDF-Viewer) in Prompts
- Teilen Sie große PDFs bei Bedarf in Chunks auf
- Aktivieren Sie Prompt-Caching für wiederholte Analysen
Skalieren Sie Ihre Implementierung
Für die Verarbeitung großer Mengen sollten Sie diese Ansätze in Betracht ziehen:
Prompt-Caching verwenden
Cachen Sie PDFs, um die Leistung bei wiederholten Abfragen zu verbessern:
Dokumenten-Batches verarbeiten
Verwenden Sie die Message Batches API für Workflows mit hohem Volumen:
Nächste Schritte
Was this page helpful?