PDF-Unterstützung (Beta)
Die Claude 3.5 Sonnet Modelle unterstützen jetzt PDF-Eingaben und verstehen sowohl Text als auch visuelle Inhalte in Dokumenten.
PDF-Unterstützung ist in öffentlicher Beta
Um auf diese Funktion zuzugreifen, fügen Sie den Header anthropic-beta: pdfs-2024-09-25
in Ihre API-Anfragen ein.
Wir werden diese offene Beta in den kommenden Wochen weiterentwickeln und schätzen Ihr Feedback. Bitte teilen Sie Ihre Ideen und Vorschläge über dieses Formular.
PDF-Fähigkeiten
Claude arbeitet mit jedem Standard-PDF. Sie können Claude zu Text, Bildern, Diagrammen und Tabellen in den von Ihnen bereitgestellten PDFs befragen. Einige Beispielanwendungen:
- Analyse von Finanzberichten und Verständnis von Diagrammen/Tabellen
- Extraktion wichtiger Informationen aus juristischen Dokumenten
- Übersetzungsunterstützung für Dokumente
- Umwandlung von Dokumenteninformationen in strukturierte Formate
Wie die PDF-Unterstützung funktioniert
Wenn Sie eine Anfrage mit einer PDF-Datei senden:
Das System extrahiert den Inhalt des Dokuments.
- Das System konvertiert jede Seite des Dokuments in ein Bild.
- Der Text von jeder Seite wird extrahiert und zusammen mit dem Bild der Seite bereitgestellt.
Claude analysiert sowohl den Text als auch die Bilder, um das Dokument besser zu verstehen.
- Dokumente werden als Kombination aus Text und Bildern zur Analyse bereitgestellt.
- Dies ermöglicht es Benutzern, Einblicke in visuelle Elemente eines PDFs zu erhalten, wie Diagramme, Schaubilder und andere nicht-textliche Inhalte.
Nutzen Sie Dokumente zusammen mit anderen Claude-Funktionen.
PDF-Unterstützung funktioniert gut zusammen mit:
- Prompt Caching: Zur Verbesserung der Leistung bei wiederholter Analyse.
- Batch-Verarbeitung: Für die Verarbeitung großer Dokumentenmengen.
- Tool-Nutzung: Um spezifische Informationen aus Dokumenten für die Verwendung als Tool-Eingaben zu extrahieren.
Einschränkungen der PDF-Unterstützung
Bevor Sie die PDF-Unterstützung in Ihre Anwendung integrieren, stellen Sie sicher, dass Ihre Dateien diese Anforderungen erfüllen:
Anforderung | Limit |
---|---|
Maximale Anfragegröße | 32MB |
Maximale Seiten pro Anfrage | 100 |
Unterstützte Modelle | claude-3-5-sonnet-20241022 , claude-3-5-sonnet-20240620 |
Bitte beachten Sie, dass beide Limits für die gesamte Anfrage-Payload gelten, einschließlich aller anderen Inhalte, die zusammen mit PDFs gesendet werden. Die bereitgestellten PDFs sollten keine Passwörter oder Verschlüsselung haben.
Da die PDF-Unterstützung auf Claudes Visionsfähigkeiten basiert, unterliegt sie denselben Einschränkungen.
Unterstützte Plattformen und Modelle
Die PDF-Unterstützung ist derzeit auf beiden Claude 3.5 Sonnet Modellen (claude-3-5-sonnet-20241022
, claude-3-5-sonnet-20240620
) über direkten API-Zugriff verfügbar. Diese Funktionalität wird bald auch auf Amazon Bedrock und Google Vertex AI unterstützt.
Berechnung der erwarteten Token-Nutzung
Die Token-Anzahl einer PDF-Datei hängt vom gesamten aus dem Dokument extrahierten Text sowie von der Seitenanzahl ab. Da jede Seite in ein Bild umgewandelt wird, gelten dieselben bildbasierten Kostenberechnungen. Jede Seite verwendet typischerweise 1.500 bis 3.000 Token, abhängig von der Inhaltsdichte. Es gelten die Standard-Eingabe-Token-Preise, ohne zusätzliche Gebühren für die PDF-Verarbeitung.
Sie können auch Token-Zählung verwenden, um die Anzahl der Token in einer Nachricht mit PDFs zu bestimmen.
Wie man PDFs in der Messages API verwendet
Hier ist ein einfaches Beispiel, das zeigt, wie man PDFs in der Messages API verwendet:
Hier sind einige weitere Beispiele, die Ihnen den Einstieg erleichtern:
Best Practices für die PDF-Analyse
- Stellen Sie sicher, dass der Text klar und lesbar ist.
- Drehen Sie Seiten in die richtige Ausrichtung.
- Verwenden Sie bei der Bezugnahme auf Seitenzahlen die logische Nummer (die von Ihrem PDF-Viewer angezeigte Nummer) anstelle der physischen Seitenzahl (die auf der Seite sichtbare Nummer)
- Verwenden Sie Standardschriftarten.
- Platzieren Sie PDFs vor Text in Anfragen.
- Teilen Sie sehr große PDFs in kleinere Teile auf, wenn Limits überschritten werden.
- Verwenden Sie Prompt Caching für wiederholte Analysen desselben Dokuments.
Nächste Schritte
Bereit, mit PDFs unter Verwendung von Claude zu arbeiten? Hier sind einige hilfreiche Ressourcen:
Was this page helpful?