Suporte a PDF
Processe PDFs com Claude 3.5 Sonnet. Extraia texto, analise gráficos e compreenda conteúdo visual de seus documentos.
Agora você pode perguntar ao Claude sobre qualquer texto, imagens, gráficos e tabelas em PDFs que você fornecer. Alguns casos de uso de exemplo:
- Análise de relatórios financeiros e compreensão de gráficos/tabelas
- Extração de informações-chave de documentos jurídicos
- Assistência na tradução de documentos
- Conversão de informações de documentos em formatos estruturados
Antes de começar
Verifique os requisitos do PDF
Claude trabalha com qualquer PDF padrão. No entanto, você deve garantir que o tamanho da sua solicitação atenda a estes requisitos ao usar o suporte a PDF:
Requisito | Limite |
---|---|
Tamanho máximo da solicitação | 32MB |
Máximo de páginas por solicitação | 100 |
Formato | PDF padrão (sem senhas/criptografia) |
Por favor, note que ambos os limites se aplicam a toda a carga útil da solicitação, incluindo qualquer outro conteúdo enviado junto com os PDFs.
Como o suporte a PDF depende das capacidades de visão do Claude, está sujeito às mesmas limitações e considerações que outras tarefas de visão.
Plataformas e modelos suportados
O suporte a PDF está atualmente disponível em ambos os modelos Claude 3.5 Sonnet (claude-3-5-sonnet-20241022
, claude-3-5-sonnet-20240620
) via acesso direto à API. Esta funcionalidade será suportada no Amazon Bedrock e Google Vertex AI em breve
Processar PDFs com Claude
Envie sua primeira solicitação de PDF
Vamos começar com um exemplo simples usando a API de Mensagens:
Como funciona o suporte a PDF
Quando você envia um PDF para o Claude, ocorrem as seguintes etapas:
O sistema extrai o conteúdo do documento.
- O sistema converte cada página do documento em uma imagem.
- O texto de cada página é extraído e fornecido junto com a imagem de cada página.
Claude analisa tanto o texto quanto as imagens para melhor compreender o documento.
- Os documentos são fornecidos como uma combinação de texto e imagens para análise.
- Isso permite que os usuários peçam insights sobre elementos visuais de um PDF, como gráficos, diagramas e outro conteúdo não textual.
Claude responde, referenciando o conteúdo do PDF se relevante.
Claude pode referenciar tanto o conteúdo textual quanto visual quando responde. Você pode melhorar ainda mais o desempenho integrando o suporte a PDF com:
- Cache de prompts: Para melhorar o desempenho para análises repetidas.
- Processamento em lote: Para processamento de documentos em alto volume.
- Uso de ferramentas: Para extrair informações específicas de documentos para uso como entradas de ferramentas.
Estime seus custos
A contagem de tokens de um arquivo PDF depende do texto total extraído do documento, bem como do número de páginas:
- Custos de tokens de texto: Cada página normalmente usa 1.500-3.000 tokens por página, dependendo da densidade do conteúdo. O preço padrão da API se aplica sem taxas adicionais de PDF.
- Custos de tokens de imagem: Como cada página é convertida em uma imagem, os mesmos cálculos de custo baseados em imagem são aplicados.
Você pode usar contagem de tokens para estimar custos para seus PDFs específicos.
Otimize o processamento de PDF
Melhore o desempenho
Siga estas melhores práticas para resultados ideais:
- Coloque PDFs antes do texto em suas solicitações
- Use fontes padrão
- Garanta que o texto esteja claro e legível
- Rotacione as páginas para a orientação vertical adequada
- Use números de página lógicos (do visualizador de PDF) nos prompts
- Divida PDFs grandes em partes quando necessário
- Ative o cache de prompts para análises repetidas
Escale sua implementação
Para processamento de alto volume, considere estas abordagens:
Use cache de prompts
Cache PDFs para melhorar o desempenho em consultas repetidas:
Processe lotes de documentos
Use a API de Lotes de Mensagens para fluxos de trabalho de alto volume:
Próximos passos
Was this page helpful?