Vous pouvez maintenant interroger Claude sur n’importe quel texte, image, graphique et tableau dans les PDF que vous fournissez. Quelques cas d’utilisation :

  • Analyser des rapports financiers et comprendre les graphiques/tableaux
  • Extraire des informations clés de documents juridiques
  • Assistance à la traduction de documents
  • Convertir les informations des documents en formats structurés

Avant de commencer

Vérifiez les exigences pour les PDF

Claude fonctionne avec n’importe quel PDF standard. Cependant, vous devez vous assurer que la taille de votre requête répond à ces exigences lorsque vous utilisez le support PDF :

ExigenceLimite
Taille maximale de la requête32 Mo
Nombre maximal de pages par requête100
FormatPDF standard (sans mot de passe/chiffrement)

Veuillez noter que les deux limites s’appliquent à l’ensemble de la charge utile de la requête, y compris tout autre contenu envoyé avec les PDF.

Comme le support PDF s’appuie sur les capacités de vision de Claude, il est soumis aux mêmes limitations et considérations que les autres tâches de vision.

Plateformes et modèles pris en charge

Le support PDF est actuellement disponible via l’accès direct à l’API et Google Vertex AI sur :

  • Claude Opus 4 (claude-opus-4-20250514)
  • Claude Sonnet 4 (claude-sonnet-4-20250514)
  • Claude Sonnet 3.7 (claude-3-7-sonnet-20250219)
  • Claude Sonnet 3.5 models (claude-3-5-sonnet-20241022, claude-3-5-sonnet-20240620)
  • Claude Haiku 3.5 (claude-3-5-haiku-20241022)

Cette fonctionnalité sera bientôt prise en charge sur Amazon Bedrock.


Traiter des PDF avec Claude

Envoyez votre première requête PDF

Commençons par un exemple simple utilisant l’API Messages. Vous pouvez fournir des PDF à Claude de trois façons :

  1. Comme une référence URL vers un PDF hébergé en ligne
  2. Comme un PDF encodé en base64 dans des blocs de contenu document
  3. Par un file_id de l’API Files

Option 1 : Document PDF basé sur URL

L’approche la plus simple consiste à référencer un PDF directement à partir d’une URL :

Option 2 : Document PDF encodé en base64

Si vous devez envoyer des PDF depuis votre système local ou lorsqu’une URL n’est pas disponible :

Option 3 : API Files

Pour les PDF que vous utiliserez à plusieurs reprises, ou lorsque vous souhaitez éviter les frais d’encodage, utilisez l’API Files :

Comment fonctionne le support PDF

Lorsque vous envoyez un PDF à Claude, les étapes suivantes se produisent :

1

Le système extrait le contenu du document.

  • Le système convertit chaque page du document en image.
  • Le texte de chaque page est extrait et fourni avec l’image de chaque page.
2

Claude analyse à la fois le texte et les images pour mieux comprendre le document.

  • Les documents sont fournis comme une combinaison de texte et d’images pour analyse.
  • Cela permet aux utilisateurs de demander des informations sur les éléments visuels d’un PDF, tels que les graphiques, les diagrammes et autres contenus non textuels.
3

Claude répond en faisant référence au contenu du PDF si pertinent.

Claude peut faire référence à la fois au contenu textuel et visuel dans sa réponse. Vous pouvez améliorer davantage les performances en intégrant le support PDF avec :

  • Mise en cache des prompts : Pour améliorer les performances pour les analyses répétées.
  • Traitement par lots : Pour le traitement de documents à haut volume.
  • Utilisation d’outils : Pour extraire des informations spécifiques des documents à utiliser comme entrées d’outils.

Estimez vos coûts

Le nombre de tokens d’un fichier PDF dépend du texte total extrait du document ainsi que du nombre de pages :

  • Coûts des tokens de texte : Chaque page utilise généralement 1 500 à 3 000 tokens par page selon la densité du contenu. La tarification API standard s’applique sans frais supplémentaires pour les PDF.
  • Coûts des tokens d’image : Comme chaque page est convertie en image, les mêmes calculs de coûts basés sur l’image sont appliqués.

Vous pouvez utiliser le comptage de tokens pour estimer les coûts de vos PDF spécifiques.


Optimiser le traitement des PDF

Améliorer les performances

Suivez ces bonnes pratiques pour des résultats optimaux :

  • Placez les PDF avant le texte dans vos requêtes
  • Utilisez des polices standard
  • Assurez-vous que le texte est clair et lisible
  • Faites pivoter les pages dans le bon sens (orientation verticale)
  • Utilisez des numéros de page logiques (du visualiseur PDF) dans les prompts
  • Divisez les grands PDF en morceaux si nécessaire
  • Activez la mise en cache des prompts pour les analyses répétées

Mettez à l’échelle votre implémentation

Pour un traitement à haut volume, envisagez ces approches :

Utilisez la mise en cache des prompts

Mettez en cache les PDF pour améliorer les performances sur les requêtes répétées :

Traitez des lots de documents

Utilisez l’API Message Batches pour les flux de travail à haut volume :

Prochaines étapes

Was this page helpful?