Support PDF (bêta)
Les modèles Claude 3.5 Sonnet prennent désormais en charge l’entrée PDF et comprennent à la fois le contenu textuel et visuel des documents.
Le support PDF est en bêta publique
Pour accéder à cette fonctionnalité, incluez l’en-tête anthropic-beta: pdfs-2024-09-25
dans vos requêtes API.
Nous continuerons à améliorer cette bêta ouverte au cours des prochaines semaines, nous apprécions donc vos retours. Veuillez partager vos idées et suggestions en utilisant ce formulaire.
Capacités PDF
Claude fonctionne avec n’importe quel PDF standard. Vous pouvez interroger Claude sur tout texte, image, graphique et tableau dans les PDF que vous fournissez. Quelques cas d’utilisation :
- Analyse des rapports financiers et compréhension des graphiques/tableaux
- Extraction d’informations clés des documents juridiques
- Assistance à la traduction de documents
- Conversion des informations des documents en formats structurés
Comment fonctionne le support PDF
Lorsque vous envoyez une requête qui inclut un fichier PDF :
Le système extrait le contenu du document.
- Le système convertit chaque page du document en image.
- Le texte de chaque page est extrait et fourni avec l’image de la page.
Claude analyse à la fois le texte et les images pour mieux comprendre le document.
- Les documents sont fournis comme une combinaison de texte et d’images pour l’analyse.
- Cela permet aux utilisateurs de demander des informations sur les éléments visuels d’un PDF, comme les graphiques, les diagrammes et autre contenu non textuel.
Utilisez les documents avec d'autres fonctionnalités de Claude.
Le support PDF fonctionne bien avec :
- La mise en cache des prompts : Pour améliorer les performances lors d’analyses répétées.
- Le traitement par lots : Pour le traitement de documents à haut volume.
- L’utilisation d’outils : Pour extraire des informations spécifiques des documents à utiliser comme entrées d’outils.
Limitations du support PDF
Avant d’intégrer le support PDF dans votre application, assurez-vous que vos fichiers répondent à ces exigences :
Exigence | Limite |
---|---|
Taille maximale de la requête | 32MB |
Maximum de pages par requête | 100 |
Modèles pris en charge | claude-3-5-sonnet-20241022 , claude-3-5-sonnet-20240620 |
Veuillez noter que ces deux limites s’appliquent à l’ensemble de la charge utile de la requête, y compris tout autre contenu envoyé avec les PDF. Les PDF fournis ne doivent pas avoir de mots de passe ni de chiffrement.
Comme le support PDF s’appuie sur les capacités de vision de Claude, il est soumis aux mêmes limitations.
Plateformes et modèles pris en charge
Le support PDF est actuellement disponible sur les deux modèles Claude 3.5 Sonnet (claude-3-5-sonnet-20241022
, claude-3-5-sonnet-20240620
) via l’accès direct à l’API. Cette fonctionnalité sera bientôt prise en charge sur Amazon Bedrock et Google Vertex AI.
Calculer l’utilisation attendue des tokens
Le nombre de tokens d’un fichier PDF dépend du texte total extrait du document ainsi que du nombre de pages. Comme chaque page est convertie en image, les mêmes calculs de coût basés sur l’image sont appliqués. Chaque page utilise généralement entre 1 500 et 3 000 tokens, selon la densité du contenu. La tarification standard des tokens d’entrée s’applique, sans frais supplémentaires pour le traitement PDF.
Vous pouvez également utiliser le comptage de tokens pour déterminer le nombre de tokens dans un message contenant des PDF.
Comment utiliser les PDF dans l’API Messages
Voici un exemple simple démontrant comment utiliser les PDF dans l’API Messages :
Voici quelques autres exemples pour vous aider à démarrer :
Meilleures pratiques pour l’analyse PDF
- Assurez-vous que le texte est clair et lisible.
- Orientez les pages dans le bon sens.
- Lorsque vous faites référence aux numéros de page, utilisez le numéro logique (le numéro indiqué par votre lecteur PDF) plutôt que le numéro de page physique (le numéro visible sur la page)
- Utilisez des polices standard.
- Placez les PDF avant le texte dans les requêtes.
- Divisez les très grands PDF en plus petits morceaux lorsque les limites sont dépassées.
- Utilisez la mise en cache des prompts pour l’analyse répétée du même document.
Prochaines étapes
Prêt à commencer à travailler avec les PDF en utilisant Claude ? Voici quelques ressources utiles :