Suporte a PDF
Processe PDFs com Claude. Extraia texto, analise gráficos e compreenda conteúdo visual dos seus documentos.
Agora você pode perguntar ao Claude sobre qualquer texto, imagens, gráficos e tabelas em PDFs que você fornecer. Alguns casos de uso de exemplo:
- Analisar relatórios financeiros e compreender gráficos/tabelas
- Extrair informações-chave de documentos legais
- Assistência de tradução para documentos
- Converter informações de documentos em formatos estruturados
Antes de começar
Verificar requisitos de PDF
Claude funciona com qualquer PDF padrão. No entanto, você deve garantir que o tamanho da sua solicitação atenda a estes requisitos ao usar o suporte a PDF:
Requisito | Limite |
---|---|
Tamanho máximo da solicitação | 32MB |
Máximo de páginas por solicitação | 100 |
Formato | PDF padrão (sem senhas/criptografia) |
Por favor, note que ambos os limites são sobre toda a carga útil da solicitação, incluindo qualquer outro conteúdo enviado junto com PDFs.
Como o suporte a PDF depende das capacidades de visão do Claude, está sujeito às mesmas limitações e considerações que outras tarefas de visão.
Plataformas e modelos suportados
O suporte a PDF é atualmente suportado via acesso direto à API e Google Vertex AI em:
- Claude Opus 4 (
claude-opus-4-20250514
) - Claude Sonnet 4 (
claude-sonnet-4-20250514
) - Claude Sonnet 3.7 (
claude-3-7-sonnet-20250219
) - Modelos Claude Sonnet 3.5 (
claude-3-5-sonnet-20241022
,claude-3-5-sonnet-20240620
) - Claude Haiku 3.5 (
claude-3-5-haiku-20241022
)
Esta funcionalidade será suportada no Amazon Bedrock em breve.
Para arquivos não-PDF como .csv, .xlsx, .docx, .md, ou .txt, veja Trabalhando com outros formatos de arquivo.
Processar PDFs com Claude
Envie sua primeira solicitação de PDF
Vamos começar com um exemplo simples usando a API Messages. Você pode fornecer PDFs ao Claude de três maneiras:
- Como uma referência de URL para um PDF hospedado online
- Como um PDF codificado em base64 em blocos de conteúdo
document
- Por um
file_id
da API Files
Opção 1: Documento PDF baseado em URL
A abordagem mais simples é referenciar um PDF diretamente de uma URL:
Opção 2: Documento PDF codificado em base64
Se você precisar enviar PDFs do seu sistema local ou quando uma URL não estiver disponível:
Opção 3: API Files
Para PDFs que você usará repetidamente, ou quando quiser evitar sobrecarga de codificação, use a API Files:
Como funciona o suporte a PDF
Quando você envia um PDF para Claude, os seguintes passos ocorrem:
O sistema extrai o conteúdo do documento.
- O sistema converte cada página do documento em uma imagem.
- O texto de cada página é extraído e fornecido junto com a imagem de cada página.
Claude analisa tanto o texto quanto as imagens para melhor compreender o documento.
- Documentos são fornecidos como uma combinação de texto e imagens para análise.
- Isso permite que os usuários peçam insights sobre elementos visuais de um PDF, como gráficos, diagramas e outro conteúdo não textual.
Claude responde, referenciando o conteúdo do PDF se relevante.
Claude pode referenciar tanto conteúdo textual quanto visual quando responde. Você pode melhorar ainda mais o desempenho integrando o suporte a PDF com:
- Cache de prompt: Para melhorar o desempenho para análise repetida.
- Processamento em lote: Para processamento de documentos de alto volume.
- Uso de ferramentas: Para extrair informações específicas de documentos para uso como entradas de ferramentas.
Estime seus custos
A contagem de tokens de um arquivo PDF depende do texto total extraído do documento, bem como do número de páginas:
- Custos de tokens de texto: Cada página normalmente usa 1.500-3.000 tokens por página dependendo da densidade do conteúdo. Preços padrão da API se aplicam sem taxas adicionais de PDF.
- Custos de tokens de imagem: Como cada página é convertida em uma imagem, os mesmos cálculos de custo baseados em imagem são aplicados.
Você pode usar contagem de tokens para estimar custos para seus PDFs específicos.
Otimizar processamento de PDF
Melhorar desempenho
Siga essas melhores práticas para resultados ótimos:
- Coloque PDFs antes do texto em suas solicitações
- Use fontes padrão
- Garanta que o texto seja claro e legível
- Gire páginas para orientação vertical adequada
- Use números de página lógicos (do visualizador de PDF) em prompts
- Divida PDFs grandes em pedaços quando necessário
- Habil cache de prompt para análise repetida
Escale sua implementação
Para processamento de alto volume, considere essas abordagens:
Use cache de prompt
Cache PDFs para melhorar o desempenho em consultas repetidas:
Processar lotes de documentos
Use a API Message Batches para fluxos de trabalho de alto volume: