Support PDF
Traitez des PDF avec Claude 3.5 Sonnet. Extrayez du texte, analysez des graphiques et comprenez le contenu visuel de vos documents.
Vous pouvez maintenant interroger Claude sur tout texte, image, graphique et tableau dans les PDF que vous fournissez. Quelques cas d’utilisation :
- Analyser des rapports financiers et comprendre les graphiques/tableaux
- Extraire des informations clés de documents juridiques
- Assistance à la traduction de documents
- Convertir les informations des documents en formats structurés
Avant de commencer
Vérifier les exigences PDF
Claude fonctionne avec n’importe quel PDF standard. Cependant, vous devez vous assurer que la taille de votre requête répond à ces exigences lors de l’utilisation du support PDF :
Exigence | Limite |
---|---|
Taille maximale de la requête | 32MB |
Maximum de pages par requête | 100 |
Format | PDF standard (sans mot de passe/chiffrement) |
Veuillez noter que ces deux limites s’appliquent à l’ensemble de la charge utile de la requête, y compris tout autre contenu envoyé avec les PDF.
Comme le support PDF s’appuie sur les capacités de vision de Claude, il est soumis aux mêmes limitations et considérations que les autres tâches de vision.
Plateformes et modèles pris en charge
Le support PDF est actuellement disponible sur les deux modèles Claude 3.5 Sonnet (claude-3-5-sonnet-20241022
, claude-3-5-sonnet-20240620
) via un accès API direct. Cette fonctionnalité sera bientôt prise en charge sur Amazon Bedrock et Google Vertex AI.
Traiter les PDF avec Claude
Envoyez votre première requête PDF
Commençons par un exemple simple utilisant l’API Messages :
Comment fonctionne le support PDF
Lorsque vous envoyez un PDF à Claude, les étapes suivantes se produisent :
Le système extrait le contenu du document.
- Le système convertit chaque page du document en image.
- Le texte de chaque page est extrait et fourni avec l’image de chaque page.
Claude analyse à la fois le texte et les images pour mieux comprendre le document.
- Les documents sont fournis comme une combinaison de texte et d’images pour l’analyse.
- Cela permet aux utilisateurs de demander des informations sur les éléments visuels d’un PDF, comme les graphiques, les diagrammes et autre contenu non textuel.
Claude répond en faisant référence au contenu du PDF si pertinent.
Claude peut faire référence au contenu textuel et visuel dans ses réponses. Vous pouvez améliorer davantage les performances en intégrant le support PDF avec :
- Mise en cache des prompts : Pour améliorer les performances pour l’analyse répétée.
- Traitement par lots : Pour le traitement de documents à haut volume.
- Utilisation d’outils : Pour extraire des informations spécifiques des documents à utiliser comme entrées d’outils.
Estimez vos coûts
Le nombre de tokens d’un fichier PDF dépend du texte total extrait du document ainsi que du nombre de pages :
- Coûts des tokens texte : Chaque page utilise généralement 1 500 à 3 000 tokens par page selon la densité du contenu. La tarification API standard s’applique sans frais PDF supplémentaires.
- Coûts des tokens image : Comme chaque page est convertie en image, les mêmes calculs de coût basés sur l’image sont appliqués.
Vous pouvez utiliser le comptage de tokens pour estimer les coûts pour vos PDF spécifiques.
Optimiser le traitement PDF
Améliorer les performances
Suivez ces bonnes pratiques pour des résultats optimaux :
- Placez les PDF avant le texte dans vos requêtes
- Utilisez des polices standard
- Assurez-vous que le texte est clair et lisible
- Faites pivoter les pages dans la bonne orientation verticale
- Utilisez des numéros de page logiques (du visualiseur PDF) dans les prompts
- Divisez les grands PDF en morceaux si nécessaire
- Activez la mise en cache des prompts pour l’analyse répétée
Mettez à l’échelle votre implémentation
Pour un traitement à haut volume, considérez ces approches :
Utiliser la mise en cache des prompts
Mettez en cache les PDF pour améliorer les performances sur les requêtes répétées :
Traiter les documents par lots
Utilisez l’API Message Batches pour les flux de travail à haut volume :
Prochaines étapes
Was this page helpful?