Agora você pode perguntar ao Claude sobre qualquer texto, imagens, gráficos e tabelas em PDFs que você fornecer. Alguns casos de uso de exemplo:

  • Análise de relatórios financeiros e compreensão de gráficos/tabelas
  • Extração de informações-chave de documentos jurídicos
  • Assistência em tradução de documentos
  • Conversão de informações de documentos em formatos estruturados

Antes de começar

Verifique os requisitos do PDF

Claude funciona com qualquer PDF padrão. No entanto, você deve garantir que o tamanho da sua solicitação atenda a estes requisitos ao usar o suporte a PDF:

RequisitoLimite
Tamanho máximo da solicitação32MB
Máximo de páginas por solicitação100
FormatoPDF padrão (sem senhas/criptografia)

Observe que ambos os limites se aplicam a toda a carga útil da solicitação, incluindo qualquer outro conteúdo enviado junto com os PDFs.

Como o suporte a PDF depende das capacidades de visão do Claude, está sujeito às mesmas limitações e considerações que outras tarefas de visão.

Plataformas e modelos suportados

O suporte a PDF é atualmente suportado via acesso direto à API e Google Vertex AI em:

  • Claude Opus 4 (claude-opus-4-20250514)
  • Claude Sonnet 4 (claude-sonnet-4-20250514)
  • Claude Sonnet 3.7 (claude-3-7-sonnet-20250219)
  • Claude Sonnet 3.5 models (claude-3-5-sonnet-20241022, claude-3-5-sonnet-20240620)
  • Claude Haiku 3.5 (claude-3-5-haiku-20241022)

Esta funcionalidade será suportada no Amazon Bedrock em breve.


Processe PDFs com Claude

Envie sua primeira solicitação de PDF

Vamos começar com um exemplo simples usando a API Messages. Você pode fornecer PDFs ao Claude de três maneiras:

  1. Como uma referência de URL para um PDF hospedado online
  2. Como um PDF codificado em base64 em blocos de conteúdo document
  3. Por um file_id da API de Arquivos

Opção 1: Documento PDF baseado em URL

A abordagem mais simples é referenciar um PDF diretamente de uma URL:

 curl https://api.anthropic.com/v1/messages \
   -H "content-type: application/json" \
   -H "x-api-key: $ANTHROPIC_API_KEY" \
   -H "anthropic-version: 2023-06-01" \
   -d '{
     "model": "claude-opus-4-20250514",
     "max_tokens": 1024,
     "messages": [{
         "role": "user",
         "content": [{
             "type": "document",
             "source": {
                 "type": "url",
                 "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
             }
         },
         {
             "type": "text",
             "text": "What are the key findings in this document?"
         }]
     }]
 }'

Opção 2: Documento PDF codificado em base64

Se você precisar enviar PDFs do seu sistema local ou quando uma URL não estiver disponível:

# Method 1: Fetch and encode a remote PDF
curl -s "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf" | base64 | tr -d '\n' > pdf_base64.txt

# Method 2: Encode a local PDF file
# base64 document.pdf | tr -d '\n' > pdf_base64.txt

# Create a JSON request file using the pdf_base64.txt content
jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 1024,
    "messages": [{
        "role": "user",
        "content": [{
            "type": "document",
            "source": {
                "type": "base64",
                "media_type": "application/pdf",
                "data": $PDF_BASE64
            }
        },
        {
            "type": "text",
            "text": "What are the key findings in this document?"
        }]
    }]
}' > request.json

# Send the API request using the JSON file
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Opção 3: API de Arquivos

Para PDFs que você usará repetidamente, ou quando quiser evitar sobrecarga de codificação, use a API de Arquivos:

# First, upload your PDF to the Files API
curl -X POST https://api.anthropic.com/v1/files \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -F "file=@document.pdf"

# Then use the returned file_id in your message
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -d '{
    "model": "claude-opus-4-20250514", 
    "max_tokens": 1024,
    "messages": [{
      "role": "user",
      "content": [{
        "type": "document",
        "source": {
          "type": "file",
          "file_id": "file_abc123"
        }
      },
      {
        "type": "text",
        "text": "What are the key findings in this document?"
      }]
    }]
  }'

Como funciona o suporte a PDF

Quando você envia um PDF para o Claude, ocorrem as seguintes etapas:

1

O sistema extrai o conteúdo do documento.

  • O sistema converte cada página do documento em uma imagem.
  • O texto de cada página é extraído e fornecido junto com a imagem de cada página.
2

Claude analisa tanto o texto quanto as imagens para entender melhor o documento.

  • Os documentos são fornecidos como uma combinação de texto e imagens para análise.
  • Isso permite que os usuários peçam insights sobre elementos visuais de um PDF, como gráficos, diagramas e outros conteúdos não textuais.
3

Claude responde, referenciando o conteúdo do PDF, se relevante.

Claude pode referenciar tanto o conteúdo textual quanto o visual ao responder. Você pode melhorar ainda mais o desempenho integrando o suporte a PDF com:

  • Cache de prompts: Para melhorar o desempenho em análises repetidas.
  • Processamento em lote: Para processamento de documentos de alto volume.
  • Uso de ferramentas: Para extrair informações específicas de documentos para uso como entradas de ferramentas.

Estime seus custos

A contagem de tokens de um arquivo PDF depende do texto total extraído do documento, bem como do número de páginas:

  • Custos de tokens de texto: Cada página normalmente usa 1.500-3.000 tokens por página, dependendo da densidade do conteúdo. O preço padrão da API se aplica sem taxas adicionais de PDF.
  • Custos de tokens de imagem: Como cada página é convertida em uma imagem, os mesmos cálculos de custo baseados em imagem são aplicados.

Você pode usar a contagem de tokens para estimar custos para seus PDFs específicos.


Otimize o processamento de PDF

Melhore o desempenho

Siga estas melhores práticas para resultados ideais:

  • Coloque PDFs antes do texto em suas solicitações
  • Use fontes padrão
  • Garanta que o texto esteja claro e legível
  • Gire as páginas para a orientação vertical adequada
  • Use números de página lógicos (do visualizador de PDF) nos prompts
  • Divida PDFs grandes em partes quando necessário
  • Ative o cache de prompts para análises repetidas

Escale sua implementação

Para processamento de alto volume, considere estas abordagens:

Use cache de prompts

Armazene PDFs em cache para melhorar o desempenho em consultas repetidas:

# Create a JSON request file using the pdf_base64.txt content
jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 1024,
    "messages": [{
        "role": "user",
        "content": [{
            "type": "document",
            "source": {
                "type": "base64",
                "media_type": "application/pdf",
                "data": $PDF_BASE64
            },
            "cache_control": {
              "type": "ephemeral"
            }
        },
        {
            "type": "text",
            "text": "Which model has the highest human preference win rates across each use-case?"
        }]
    }]
}' >request.json

# Then make the API call using the JSON file
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Processe lotes de documentos

Use a API de Lotes de Mensagens para fluxos de trabalho de alto volume:

# Create a JSON request file using the pdf_base64.txt content
jq -n --rawfile PDF_BASE64 pdf_base64.txt '
{
  "requests": [
      {
          "custom_id": "my-first-request",
          "params": {
              "model": "claude-opus-4-20250514",
              "max_tokens": 1024,
              "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "document",
                            "source": {
 "type": "base64",
 "media_type": "application/pdf",
 "data": $PDF_BASE64
                            }
                        },
                        {
                            "type": "text",
                            "text": "Which model has the highest human preference win rates across each use-case?"
                        }
                    ]
                }
              ]
          }
      },
      {
          "custom_id": "my-second-request",
          "params": {
              "model": "claude-opus-4-20250514",
              "max_tokens": 1024,
              "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "document",
                            "source": {
 "type": "base64",
 "media_type": "application/pdf",
 "data": $PDF_BASE64
                            }
                        },
                        {
                            "type": "text",
                            "text": "Extract 5 key insights from this document."
                        }
                    ]
                }
              ]
          }
      }
  ]
}
' > request.json

# Then make the API call using the JSON file
curl https://api.anthropic.com/v1/messages/batches \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Próximos passos