Soporte para PDF
Procesa PDFs con Claude. Extrae texto, analiza gráficos y comprende contenido visual de tus documentos.
Ahora puedes preguntarle a Claude sobre cualquier texto, imágenes, gráficos y tablas en los PDFs que proporciones. Algunos casos de uso de ejemplo:
- Analizar informes financieros y comprender gráficos/tablas
- Extraer información clave de documentos legales
- Asistencia de traducción para documentos
- Convertir información de documentos en formatos estructurados
Antes de comenzar
Verificar requisitos de PDF
Claude funciona con cualquier PDF estándar. Sin embargo, debes asegurarte de que el tamaño de tu solicitud cumpla con estos requisitos al usar el soporte para PDF:
Requisito | Límite |
---|---|
Tamaño máximo de solicitud | 32MB |
Páginas máximas por solicitud | 100 |
Formato | PDF estándar (sin contraseñas/cifrado) |
Ten en cuenta que ambos límites se aplican a toda la carga útil de la solicitud, incluyendo cualquier otro contenido enviado junto con los PDFs.
Dado que el soporte para PDF se basa en las capacidades de visión de Claude, está sujeto a las mismas limitaciones y consideraciones que otras tareas de visión.
Plataformas y modelos compatibles
El soporte para PDF está actualmente disponible a través del acceso directo a la API y Google Vertex AI en:
- Claude Opus 4 (
claude-opus-4-20250514
) - Claude Sonnet 4 (
claude-sonnet-4-20250514
) - Claude Sonnet 3.7 (
claude-3-7-sonnet-20250219
) - Modelos Claude Sonnet 3.5 (
claude-3-5-sonnet-20241022
,claude-3-5-sonnet-20240620
) - Claude Haiku 3.5 (
claude-3-5-haiku-20241022
)
Esta funcionalidad será compatible con Amazon Bedrock pronto.
Para archivos que no sean PDF como .csv, .xlsx, .docx, .md, o .txt, consulta Trabajar con otros formatos de archivo.
Procesar PDFs con Claude
Envía tu primera solicitud de PDF
Comencemos con un ejemplo simple usando la API de Messages. Puedes proporcionar PDFs a Claude de tres maneras:
- Como una referencia URL a un PDF alojado en línea
- Como un PDF codificado en base64 en bloques de contenido
document
- Por un
file_id
de la API de Files
Opción 1: Documento PDF basado en URL
El enfoque más simple es hacer referencia a un PDF directamente desde una URL:
Opción 2: Documento PDF codificado en base64
Si necesitas enviar PDFs desde tu sistema local o cuando una URL no está disponible:
Opción 3: API de Files
Para PDFs que usarás repetidamente, o cuando quieras evitar la sobrecarga de codificación, usa la API de Files:
Cómo funciona el soporte para PDF
Cuando envías un PDF a Claude, ocurren los siguientes pasos:
El sistema extrae el contenido del documento.
- El sistema convierte cada página del documento en una imagen.
- El texto de cada página se extrae y se proporciona junto con la imagen de cada página.
Claude analiza tanto el texto como las imágenes para comprender mejor el documento.
- Los documentos se proporcionan como una combinación de texto e imágenes para análisis.
- Esto permite a los usuarios pedir información sobre elementos visuales de un PDF, como gráficos, diagramas y otro contenido no textual.
Claude responde, haciendo referencia al contenido del PDF si es relevante.
Claude puede hacer referencia tanto al contenido textual como visual cuando responde. Puedes mejorar aún más el rendimiento integrando el soporte para PDF con:
- Caché de prompts: Para mejorar el rendimiento en análisis repetidos.
- Procesamiento por lotes: Para procesamiento de documentos de alto volumen.
- Uso de herramientas: Para extraer información específica de documentos para usar como entradas de herramientas.
Estima tus costos
El conteo de tokens de un archivo PDF depende del texto total extraído del documento así como del número de páginas:
- Costos de tokens de texto: Cada página típicamente usa 1,500-3,000 tokens por página dependiendo de la densidad del contenido. Se aplican los precios estándar de la API sin tarifas adicionales por PDF.
- Costos de tokens de imagen: Dado que cada página se convierte en una imagen, se aplican los mismos cálculos de costos basados en imágenes.
Puedes usar conteo de tokens para estimar costos para tus PDFs específicos.
Optimizar el procesamiento de PDF
Mejorar el rendimiento
Sigue estas mejores prácticas para obtener resultados óptimos:
- Coloca los PDFs antes del texto en tus solicitudes
- Usa fuentes estándar
- Asegúrate de que el texto sea claro y legible
- Rota las páginas a la orientación vertical correcta
- Usa números de página lógicos (del visor de PDF) en los prompts
- Divide PDFs grandes en fragmentos cuando sea necesario
- Habilita el caché de prompts para análisis repetidos
Escala tu implementación
Para procesamiento de alto volumen, considera estos enfoques:
Usar caché de prompts
Almacena en caché los PDFs para mejorar el rendimiento en consultas repetidas:
Procesar lotes de documentos
Usa la API de Message Batches para flujos de trabajo de alto volumen: