Ora puoi chiedere a Claude di qualsiasi testo, immagini, grafici e tabelle nei PDF che fornisci. Alcuni casi d’uso di esempio:

  • Analizzare report finanziari e comprendere grafici/tabelle
  • Estrarre informazioni chiave da documenti legali
  • Assistenza alla traduzione per documenti
  • Convertire informazioni di documenti in formati strutturati

Prima di iniziare

Verifica i requisiti PDF

Claude funziona con qualsiasi PDF standard. Tuttavia, dovresti assicurarti che la dimensione della tua richiesta soddisfi questi requisiti quando usi il supporto PDF:

RequisitoLimite
Dimensione massima richiesta32MB
Pagine massime per richiesta100
FormatoPDF standard (nessuna password/crittografia)

Si prega di notare che entrambi i limiti sono sull’intero payload della richiesta, incluso qualsiasi altro contenuto inviato insieme ai PDF.

Poiché il supporto PDF si basa sulle capacità di visione di Claude, è soggetto alle stesse limitazioni e considerazioni di altre attività di visione.

Piattaforme e modelli supportati

Il supporto PDF è attualmente supportato tramite accesso API diretto e Google Vertex AI su:

  • Claude Opus 4 (claude-opus-4-20250514)
  • Claude Sonnet 4 (claude-sonnet-4-20250514)
  • Claude Sonnet 3.7 (claude-3-7-sonnet-20250219)
  • Modelli Claude Sonnet 3.5 (claude-3-5-sonnet-20241022, claude-3-5-sonnet-20240620)
  • Claude Haiku 3.5 (claude-3-5-haiku-20241022)

Il supporto PDF è ora disponibile su Amazon Bedrock con le seguenti considerazioni:

Supporto PDF Amazon Bedrock

Quando si utilizza il supporto PDF tramite l’API Converse di Amazon Bedrock, ci sono due modalità distinte di elaborazione dei documenti:

Importante: Per accedere alle complete capacità di comprensione visiva PDF di Claude nell’API Converse, devi abilitare le citazioni. Senza le citazioni abilitate, l’API ricade solo sull’estrazione di testo di base. Scopri di più su lavorare con le citazioni.

Modalità di Elaborazione Documenti

  1. Converse Document Chat (Modalità originale - Solo estrazione testo)

    • Fornisce estrazione di testo di base dai PDF
    • Non può analizzare immagini, grafici o layout visivi all’interno dei PDF
    • Utilizza circa 1.000 token per un PDF di 3 pagine
    • Utilizzato automaticamente quando le citazioni non sono abilitate
  2. Claude PDF Chat (Nuova modalità - Comprensione visiva completa)

    • Fornisce analisi visiva completa dei PDF
    • Può comprendere e analizzare grafici, diagrammi, immagini e layout visivi
    • Elabora ogni pagina sia come testo che come immagine per una comprensione completa
    • Utilizza circa 7.000 token per un PDF di 3 pagine
    • Richiede che le citazioni siano abilitate nell’API Converse

Limitazioni Chiave

  • API Converse: L’analisi visiva PDF richiede che le citazioni siano abilitate. Attualmente non c’è opzione per utilizzare l’analisi visiva senza citazioni (a differenza dell’API InvokeModel).
  • API InvokeModel: Fornisce controllo completo sull’elaborazione PDF senza citazioni forzate.

Problemi Comuni

Se i clienti segnalano che Claude non vede immagini o grafici nei loro PDF quando usa l’API Converse, probabilmente devono abilitare il flag delle citazioni. Senza di esso, Converse ricade solo sull’estrazione di testo di base.

Questo è un vincolo noto con l’API Converse che stiamo lavorando per risolvere. Per applicazioni che richiedono analisi visiva PDF senza citazioni, considera di utilizzare invece l’API InvokeModel.

Per file non-PDF come .csv, .xlsx, .docx, .md, o .txt, vedi Lavorare con altri formati di file.


Elabora PDF con Claude

Invia la tua prima richiesta PDF

Iniziamo con un esempio semplice usando l’API Messages. Puoi fornire PDF a Claude in tre modi:

  1. Come riferimento URL a un PDF ospitato online
  2. Come PDF codificato in base64 in blocchi di contenuto document
  3. Tramite un file_id dall’API Files

Opzione 1: Documento PDF basato su URL

L’approccio più semplice è riferirsi a un PDF direttamente da un URL:

 curl https://api.anthropic.com/v1/messages \
   -H "content-type: application/json" \
   -H "x-api-key: $ANTHROPIC_API_KEY" \
   -H "anthropic-version: 2023-06-01" \
   -d '{
     "model": "claude-opus-4-20250514",
     "max_tokens": 1024,
     "messages": [{
         "role": "user",
         "content": [{
             "type": "document",
             "source": {
                 "type": "url",
                 "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
             }
         },
         {
             "type": "text",
             "text": "Quali sono i risultati chiave in questo documento?"
         }]
     }]
 }'

Opzione 2: Documento PDF codificato in base64

Se devi inviare PDF dal tuo sistema locale o quando un URL non è disponibile:

# Metodo 1: Recupera e codifica un PDF remoto
curl -s "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf" | base64 | tr -d '\n' > pdf_base64.txt

# Metodo 2: Codifica un file PDF locale
# base64 document.pdf | tr -d '\n' > pdf_base64.txt

# Crea un file di richiesta JSON usando il contenuto di pdf_base64.txt
jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 1024,
    "messages": [{
        "role": "user",
        "content": [{
            "type": "document",
            "source": {
                "type": "base64",
                "media_type": "application/pdf",
                "data": $PDF_BASE64
            }
        },
        {
            "type": "text",
            "text": "Quali sono i risultati chiave in questo documento?"
        }]
    }]
}' > request.json

# Invia la richiesta API usando il file JSON
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Opzione 3: API Files

Per PDF che userai ripetutamente, o quando vuoi evitare il sovraccarico di codifica, usa l’API Files:

# Prima, carica il tuo PDF nell'API Files
curl -X POST https://api.anthropic.com/v1/files \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -F "file=@document.pdf"

# Poi usa il file_id restituito nel tuo messaggio
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -d '{
    "model": "claude-opus-4-20250514", 
    "max_tokens": 1024,
    "messages": [{
      "role": "user",
      "content": [{
        "type": "document",
        "source": {
          "type": "file",
          "file_id": "file_abc123"
        }
      },
      {
        "type": "text",
        "text": "Quali sono i risultati chiave in questo documento?"
      }]
    }]
  }'

Come funziona il supporto PDF

Quando invii un PDF a Claude, si verificano i seguenti passaggi:

1

Il sistema estrae i contenuti del documento.

  • Il sistema converte ogni pagina del documento in un’immagine.
  • Il testo di ogni pagina viene estratto e fornito insieme all’immagine di ogni pagina.
2

Claude analizza sia il testo che le immagini per comprendere meglio il documento.

  • I documenti sono forniti come combinazione di testo e immagini per l’analisi.
  • Questo permette agli utenti di chiedere approfondimenti su elementi visivi di un PDF, come grafici, diagrammi e altri contenuti non testuali.
3

Claude risponde, facendo riferimento ai contenuti del PDF se pertinenti.

Claude può fare riferimento sia al contenuto testuale che visivo quando risponde. Puoi migliorare ulteriormente le prestazioni integrando il supporto PDF con:

  • Prompt caching: Per migliorare le prestazioni per analisi ripetute.
  • Elaborazione batch: Per elaborazione di documenti ad alto volume.
  • Uso di strumenti: Per estrarre informazioni specifiche dai documenti per l’uso come input di strumenti.

Stima i tuoi costi

Il conteggio dei token di un file PDF dipende dal testo totale estratto dal documento così come dal numero di pagine:

  • Costi token testo: Ogni pagina tipicamente usa 1.500-3.000 token per pagina a seconda della densità del contenuto. Si applica il prezzo API standard senza tariffe aggiuntive per PDF.
  • Costi token immagine: Poiché ogni pagina è convertita in un’immagine, si applicano gli stessi calcoli di costo basati su immagini.

Puoi usare il conteggio dei token per stimare i costi per i tuoi PDF specifici.


Ottimizza l’elaborazione PDF

Migliora le prestazioni

Segui queste migliori pratiche per risultati ottimali:

  • Posiziona i PDF prima del testo nelle tue richieste
  • Usa font standard
  • Assicurati che il testo sia chiaro e leggibile
  • Ruota le pagine nell’orientamento verticale corretto
  • Usa numeri di pagina logici (dal visualizzatore PDF) nei prompt
  • Dividi PDF grandi in blocchi quando necessario
  • Abilita il prompt caching per analisi ripetute

Scala la tua implementazione

Per elaborazione ad alto volume, considera questi approcci:

Usa il prompt caching

Memorizza nella cache i PDF per migliorare le prestazioni su query ripetute:

# Crea un file di richiesta JSON usando il contenuto di pdf_base64.txt
jq -n --rawfile PDF_BASE64 pdf_base64.txt '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 1024,
    "messages": [{
        "role": "user",
        "content": [{
            "type": "document",
            "source": {
                "type": "base64",
                "media_type": "application/pdf",
                "data": $PDF_BASE64
            },
            "cache_control": {
              "type": "ephemeral"
            }
        },
        {
            "type": "text",
            "text": "Quale modello ha i tassi di vittoria di preferenza umana più alti in ogni caso d'uso?"
        }]
    }]
}' > request.json

# Poi fai la chiamata API usando il file JSON
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Elabora batch di documenti

Usa l’API Message Batches per flussi di lavoro ad alto volume:

# Crea un file di richiesta JSON usando il contenuto di pdf_base64.txt
jq -n --rawfile PDF_BASE64 pdf_base64.txt '
{
  "requests": [
      {
          "custom_id": "my-first-request",
          "params": {
              "model": "claude-opus-4-20250514",
              "max_tokens": 1024,
              "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "document",
                            "source": {
 "type": "base64",
 "media_type": "application/pdf",
 "data": $PDF_BASE64
                            }
                        },
                        {
                            "type": "text",
                            "text": "Quale modello ha i tassi di vittoria di preferenza umana più alti in ogni caso d'uso?"
                        }
                    ]
                }
              ]
          }
      },
      {
          "custom_id": "my-second-request",
          "params": {
              "model": "claude-opus-4-20250514",
              "max_tokens": 1024,
              "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "document",
                            "source": {
 "type": "base64",
 "media_type": "application/pdf",
 "data": $PDF_BASE64
                            }
                        },
                        {
                            "type": "text",
                            "text": "Estrai 5 approfondimenti chiave da questo documento."
                        }
                    ]
                }
              ]
          }
      }
  ]
}
' > request.json

# Poi fai la chiamata API usando il file JSON
curl https://api.anthropic.com/v1/messages/batches \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d @request.json

Prossimi passi