Ahora puedes preguntarle a Claude sobre cualquier texto, imágenes, gráficos y tablas en los PDFs que proporciones. Algunos casos de uso de ejemplo:

  • Análisis de informes financieros y comprensión de gráficos/tablas
  • Extracción de información clave de documentos legales
  • Asistencia en traducción de documentos
  • Conversión de información de documentos a formatos estructurados

Antes de comenzar

Verifica los requisitos del PDF

Claude funciona con cualquier PDF estándar. Sin embargo, debes asegurarte de que el tamaño de tu solicitud cumpla con estos requisitos cuando uses el soporte para PDF:

RequisitoLímite
Tamaño máximo de solicitud32MB
Máximo de páginas por solicitud100
FormatoPDF estándar (sin contraseñas/encriptación)

Ten en cuenta que ambos límites aplican a toda la carga útil de la solicitud, incluyendo cualquier otro contenido enviado junto con los PDFs.

Dado que el soporte para PDF se basa en las capacidades de visión de Claude, está sujeto a las mismas limitaciones y consideraciones que otras tareas de visión.

Plataformas y modelos compatibles

El soporte para PDF está actualmente disponible en ambos modelos Claude 3.5 Sonnet (claude-3-5-sonnet-20241022, claude-3-5-sonnet-20240620) a través del acceso directo a la API. Esta funcionalidad será compatible con Amazon Bedrock y Google Vertex AI próximamente.


Procesar PDFs con Claude

Envía tu primera solicitud PDF

Comencemos con un ejemplo simple usando la API de Messages:

Cómo funciona el soporte para PDF

Cuando envías un PDF a Claude, ocurren los siguientes pasos:

1

El sistema extrae el contenido del documento.

  • El sistema convierte cada página del documento en una imagen.
  • El texto de cada página se extrae y se proporciona junto con la imagen de cada página.
2

Claude analiza tanto el texto como las imágenes para comprender mejor el documento.

  • Los documentos se proporcionan como una combinación de texto e imágenes para su análisis.
  • Esto permite a los usuarios solicitar información sobre elementos visuales de un PDF, como gráficos, diagramas y otro contenido no textual.
3

Claude responde, haciendo referencia al contenido del PDF si es relevante.

Claude puede hacer referencia tanto al contenido textual como visual cuando responde. Puedes mejorar aún más el rendimiento integrando el soporte para PDF con:

  • Almacenamiento en caché de prompts: Para mejorar el rendimiento en análisis repetidos.
  • Procesamiento por lotes: Para procesamiento de documentos de alto volumen.
  • Uso de herramientas: Para extraer información específica de documentos para usar como entradas de herramientas.

Estima tus costos

El recuento de tokens de un archivo PDF depende del texto total extraído del documento así como del número de páginas:

  • Costos de tokens de texto: Cada página típicamente usa 1,500-3,000 tokens por página dependiendo de la densidad del contenido. Se aplican los precios estándar de API sin tarifas adicionales por PDF.
  • Costos de tokens de imagen: Ya que cada página se convierte en una imagen, se aplican los mismos cálculos de costo basados en imagen.

Puedes usar el conteo de tokens para estimar costos para tus PDFs específicos.


Optimiza el procesamiento de PDF

Mejora el rendimiento

Sigue estas mejores prácticas para obtener resultados óptimos:

  • Coloca los PDFs antes del texto en tus solicitudes
  • Usa fuentes estándar
  • Asegúrate de que el texto sea claro y legible
  • Rota las páginas a la orientación vertical correcta
  • Usa números de página lógicos (del visor de PDF) en los prompts
  • Divide PDFs grandes en fragmentos cuando sea necesario
  • Habilita el almacenamiento en caché de prompts para análisis repetidos

Escala tu implementación

Para procesamiento de alto volumen, considera estos enfoques:

Usa almacenamiento en caché de prompts

Almacena en caché los PDFs para mejorar el rendimiento en consultas repetidas:

Procesa lotes de documentos

Usa la API de Message Batches para flujos de trabajo de alto volumen:

Siguientes pasos