Suporte a PDF
Processe PDFs com Claude. Extraia texto, analise gráficos e compreenda conteúdo visual de seus documentos.
Agora você pode perguntar ao Claude sobre qualquer texto, imagens, gráficos e tabelas em PDFs que você fornecer. Alguns casos de uso de exemplo:
- Analisar relatórios financeiros e compreender gráficos/tabelas
- Extrair informações-chave de documentos legais
- Assistência de tradução para documentos
- Converter informações de documentos em formatos estruturados
Antes de começar
Verificar requisitos de PDF
Claude funciona com qualquer PDF padrão. No entanto, você deve garantir que o tamanho da sua solicitação atenda a esses requisitos ao usar o suporte a PDF:
Requisito | Limite |
---|---|
Tamanho máximo da solicitação | 32MB |
Máximo de páginas por solicitação | 100 |
Formato | PDF padrão (sem senhas/criptografia) |
Observe que ambos os limites são para toda a carga útil da solicitação, incluindo qualquer outro conteúdo enviado junto com PDFs.
Como o suporte a PDF depende das capacidades de visão do Claude, está sujeito às mesmas limitações e considerações que outras tarefas de visão.
Plataformas e modelos suportados
O suporte a PDF é atualmente suportado via acesso direto à API e Google Vertex AI em:
- Claude Opus 4 (
claude-opus-4-20250514
) - Claude Sonnet 4 (
claude-sonnet-4-20250514
) - Claude Sonnet 3.7 (
claude-3-7-sonnet-20250219
) - Modelos Claude Sonnet 3.5 (
claude-3-5-sonnet-20241022
,claude-3-5-sonnet-20240620
) - Claude Haiku 3.5 (
claude-3-5-haiku-20241022
)
O suporte a PDF agora está disponível no Amazon Bedrock com as seguintes considerações:
Suporte a PDF do Amazon Bedrock
Ao usar o suporte a PDF através da API Converse do Amazon Bedrock, existem dois modos distintos de processamento de documentos:
Importante: Para acessar as capacidades completas de compreensão visual de PDF do Claude na API Converse, você deve habilitar citações. Sem citações habilitadas, a API volta para extração básica de texto apenas. Saiba mais sobre trabalhar com citações.
Modos de Processamento de Documentos
-
Converse Document Chat (Modo original - Extração de texto apenas)
- Fornece extração básica de texto de PDFs
- Não pode analisar imagens, gráficos ou layouts visuais dentro de PDFs
- Usa aproximadamente 1.000 tokens para um PDF de 3 páginas
- Usado automaticamente quando citações não estão habilitadas
-
Claude PDF Chat (Novo modo - Compreensão visual completa)
- Fornece análise visual completa de PDFs
- Pode compreender e analisar gráficos, diagramas, imagens e layouts visuais
- Processa cada página como texto e imagem para compreensão abrangente
- Usa aproximadamente 7.000 tokens para um PDF de 3 páginas
- Requer citações habilitadas na API Converse
Limitações Principais
- API Converse: Análise visual de PDF requer citações habilitadas. Atualmente não há opção para usar análise visual sem citações (diferente da API InvokeModel).
- API InvokeModel: Fornece controle total sobre processamento de PDF sem citações forçadas.
Problemas Comuns
Se clientes relatarem que Claude não está vendo imagens ou gráficos em seus PDFs ao usar a API Converse, eles provavelmente precisam habilitar a flag de citações. Sem ela, Converse volta para extração básica de texto apenas.
Esta é uma restrição conhecida com a API Converse que estamos trabalhando para resolver. Para aplicações que requerem análise visual de PDF sem citações, considere usar a API InvokeModel em vez disso.
Para arquivos não-PDF como .csv, .xlsx, .docx, .md, ou .txt, veja Trabalhando com outros formatos de arquivo.
Processar PDFs com Claude
Envie sua primeira solicitação de PDF
Vamos começar com um exemplo simples usando a API Messages. Você pode fornecer PDFs ao Claude de três maneiras:
- Como uma referência de URL para um PDF hospedado online
- Como um PDF codificado em base64 em blocos de conteúdo
document
- Por um
file_id
da API Files
Opção 1: Documento PDF baseado em URL
A abordagem mais simples é referenciar um PDF diretamente de uma URL:
Opção 2: Documento PDF codificado em base64
Se você precisar enviar PDFs do seu sistema local ou quando uma URL não estiver disponível:
Opção 3: API Files
Para PDFs que você usará repetidamente, ou quando quiser evitar sobrecarga de codificação, use a API Files:
Como funciona o suporte a PDF
Quando você envia um PDF para Claude, os seguintes passos ocorrem:
O sistema extrai o conteúdo do documento.
- O sistema converte cada página do documento em uma imagem.
- O texto de cada página é extraído e fornecido junto com a imagem de cada página.
Claude analisa tanto o texto quanto as imagens para melhor compreender o documento.
- Documentos são fornecidos como uma combinação de texto e imagens para análise.
- Isso permite que usuários peçam insights sobre elementos visuais de um PDF, como gráficos, diagramas e outro conteúdo não textual.
Claude responde, referenciando o conteúdo do PDF se relevante.
Claude pode referenciar tanto conteúdo textual quanto visual quando responde. Você pode melhorar ainda mais o desempenho integrando o suporte a PDF com:
- Cache de prompt: Para melhorar o desempenho para análise repetida.
- Processamento em lote: Para processamento de documentos de alto volume.
- Uso de ferramentas: Para extrair informações específicas de documentos para uso como entradas de ferramentas.
Estime seus custos
A contagem de tokens de um arquivo PDF depende do texto total extraído do documento, bem como do número de páginas:
- Custos de tokens de texto: Cada página normalmente usa 1.500-3.000 tokens por página dependendo da densidade do conteúdo. Preços padrão da API se aplicam sem taxas adicionais de PDF.
- Custos de tokens de imagem: Como cada página é convertida em uma imagem, os mesmos cálculos de custo baseados em imagem são aplicados.
Você pode usar contagem de tokens para estimar custos para seus PDFs específicos.
Otimizar processamento de PDF
Melhorar desempenho
Siga essas melhores práticas para resultados ótimos:
- Coloque PDFs antes do texto em suas solicitações
- Use fontes padrão
- Garanta que o texto seja claro e legível
- Gire páginas para orientação vertical adequada
- Use números de página lógicos (do visualizador de PDF) em prompts
- Divida PDFs grandes em pedaços quando necessário
- Habilite cache de prompt para análise repetida
Escalar sua implementação
Para processamento de alto volume, considere essas abordagens:
Use cache de prompt
Cache PDFs para melhorar desempenho em consultas repetidas:
Processar lotes de documentos
Use a API Message Batches para fluxos de trabalho de alto volume: