Suporte a PDF
Processe PDFs com Claude. Extraia texto, analise gráficos e compreenda conteúdo visual de seus documentos.
Agora você pode perguntar ao Claude sobre qualquer texto, imagens, gráficos e tabelas em PDFs que você fornecer. Alguns casos de uso de exemplo:
- Análise de relatórios financeiros e compreensão de gráficos/tabelas
- Extração de informações-chave de documentos jurídicos
- Assistência em tradução de documentos
- Conversão de informações de documentos em formatos estruturados
Antes de começar
Verifique os requisitos do PDF
Claude funciona com qualquer PDF padrão. No entanto, você deve garantir que o tamanho da sua solicitação atenda a estes requisitos ao usar o suporte a PDF:
Requisito | Limite |
---|---|
Tamanho máximo da solicitação | 32MB |
Máximo de páginas por solicitação | 100 |
Formato | PDF padrão (sem senhas/criptografia) |
Observe que ambos os limites se aplicam a toda a carga útil da solicitação, incluindo qualquer outro conteúdo enviado junto com os PDFs.
Como o suporte a PDF depende das capacidades de visão do Claude, está sujeito às mesmas limitações e considerações que outras tarefas de visão.
Plataformas e modelos suportados
O suporte a PDF é atualmente suportado via acesso direto à API e Google Vertex AI em:
- Claude Opus 4 (
claude-opus-4-20250514
) - Claude Sonnet 4 (
claude-sonnet-4-20250514
) - Claude Sonnet 3.7 (
claude-3-7-sonnet-20250219
) - Claude Sonnet 3.5 models (
claude-3-5-sonnet-20241022
,claude-3-5-sonnet-20240620
) - Claude Haiku 3.5 (
claude-3-5-haiku-20241022
)
Esta funcionalidade será suportada no Amazon Bedrock em breve.
Processe PDFs com Claude
Envie sua primeira solicitação de PDF
Vamos começar com um exemplo simples usando a API Messages. Você pode fornecer PDFs ao Claude de três maneiras:
- Como uma referência de URL para um PDF hospedado online
- Como um PDF codificado em base64 em blocos de conteúdo
document
- Por um
file_id
da API de Arquivos
Opção 1: Documento PDF baseado em URL
A abordagem mais simples é referenciar um PDF diretamente de uma URL:
Opção 2: Documento PDF codificado em base64
Se você precisar enviar PDFs do seu sistema local ou quando uma URL não estiver disponível:
Opção 3: API de Arquivos
Para PDFs que você usará repetidamente, ou quando quiser evitar sobrecarga de codificação, use a API de Arquivos:
Como funciona o suporte a PDF
Quando você envia um PDF para o Claude, ocorrem as seguintes etapas:
O sistema extrai o conteúdo do documento.
- O sistema converte cada página do documento em uma imagem.
- O texto de cada página é extraído e fornecido junto com a imagem de cada página.
Claude analisa tanto o texto quanto as imagens para entender melhor o documento.
- Os documentos são fornecidos como uma combinação de texto e imagens para análise.
- Isso permite que os usuários peçam insights sobre elementos visuais de um PDF, como gráficos, diagramas e outros conteúdos não textuais.
Claude responde, referenciando o conteúdo do PDF, se relevante.
Claude pode referenciar tanto o conteúdo textual quanto o visual ao responder. Você pode melhorar ainda mais o desempenho integrando o suporte a PDF com:
- Cache de prompts: Para melhorar o desempenho em análises repetidas.
- Processamento em lote: Para processamento de documentos de alto volume.
- Uso de ferramentas: Para extrair informações específicas de documentos para uso como entradas de ferramentas.
Estime seus custos
A contagem de tokens de um arquivo PDF depende do texto total extraído do documento, bem como do número de páginas:
- Custos de tokens de texto: Cada página normalmente usa 1.500-3.000 tokens por página, dependendo da densidade do conteúdo. O preço padrão da API se aplica sem taxas adicionais de PDF.
- Custos de tokens de imagem: Como cada página é convertida em uma imagem, os mesmos cálculos de custo baseados em imagem são aplicados.
Você pode usar a contagem de tokens para estimar custos para seus PDFs específicos.
Otimize o processamento de PDF
Melhore o desempenho
Siga estas melhores práticas para resultados ideais:
- Coloque PDFs antes do texto em suas solicitações
- Use fontes padrão
- Garanta que o texto esteja claro e legível
- Gire as páginas para a orientação vertical adequada
- Use números de página lógicos (do visualizador de PDF) nos prompts
- Divida PDFs grandes em partes quando necessário
- Ative o cache de prompts para análises repetidas
Escale sua implementação
Para processamento de alto volume, considere estas abordagens:
Use cache de prompts
Armazene PDFs em cache para melhorar o desempenho em consultas repetidas:
Processe lotes de documentos
Use a API de Lotes de Mensagens para fluxos de trabalho de alto volume: