Supporto PDF
Elabora PDF con Claude. Estrai testo, analizza grafici e comprendi contenuti visivi dai tuoi documenti.
Ora puoi chiedere a Claude informazioni su qualsiasi testo, immagine, grafico e tabella nei PDF che fornisci. Alcuni casi d’uso di esempio:
- Analizzare report finanziari e comprendere grafici/tabelle
- Estrarre informazioni chiave da documenti legali
- Assistenza nella traduzione di documenti
- Convertire informazioni dei documenti in formati strutturati
Prima di iniziare
Verifica i requisiti dei PDF
Claude funziona con qualsiasi PDF standard. Tuttavia, dovresti assicurarti che le dimensioni della tua richiesta soddisfino questi requisiti quando utilizzi il supporto PDF:
Requisito | Limite |
---|---|
Dimensione massima della richiesta | 32MB |
Numero massimo di pagine per richiesta | 100 |
Formato | PDF standard (senza password/crittografia) |
Si prega di notare che entrambi i limiti si applicano all’intero payload della richiesta, incluso qualsiasi altro contenuto inviato insieme ai PDF.
Poiché il supporto PDF si basa sulle capacità di visione di Claude, è soggetto alle stesse limitazioni e considerazioni di altri compiti di visione.
Piattaforme e modelli supportati
Il supporto PDF è attualmente disponibile tramite accesso diretto all’API e Google Vertex AI su:
- Claude Opus 4 (
claude-opus-4-20250514
) - Claude Sonnet 4 (
claude-sonnet-4-20250514
) - Claude Sonnet 3.7 (
claude-3-7-sonnet-20250219
) - Claude Sonnet 3.5 models (
claude-3-5-sonnet-20241022
,claude-3-5-sonnet-20240620
) - Claude Haiku 3.5 (
claude-3-5-haiku-20241022
)
Questa funzionalità sarà supportata su Amazon Bedrock a breve.
Elabora PDF con Claude
Invia la tua prima richiesta PDF
Iniziamo con un semplice esempio utilizzando l’API Messages. Puoi fornire PDF a Claude in tre modi:
- Come riferimento URL a un PDF ospitato online
- Come PDF codificato in base64 nei blocchi di contenuto
document
- Tramite un
file_id
dall’API Files
Opzione 1: Documento PDF basato su URL
L’approccio più semplice è fare riferimento a un PDF direttamente da un URL:
Opzione 2: Documento PDF codificato in base64
Se hai bisogno di inviare PDF dal tuo sistema locale o quando un URL non è disponibile:
Opzione 3: API Files
Per i PDF che utilizzerai ripetutamente, o quando vuoi evitare l’overhead di codifica, usa l’API Files:
Come funziona il supporto PDF
Quando invii un PDF a Claude, si verificano i seguenti passaggi:
Il sistema estrae i contenuti del documento.
- Il sistema converte ogni pagina del documento in un’immagine.
- Il testo di ogni pagina viene estratto e fornito insieme all’immagine di ciascuna pagina.
Claude analizza sia il testo che le immagini per comprendere meglio il documento.
- I documenti vengono forniti come una combinazione di testo e immagini per l’analisi.
- Questo permette agli utenti di chiedere informazioni sugli elementi visivi di un PDF, come grafici, diagrammi e altri contenuti non testuali.
Claude risponde, facendo riferimento ai contenuti del PDF se pertinente.
Claude può fare riferimento sia ai contenuti testuali che visivi quando risponde. Puoi migliorare ulteriormente le prestazioni integrando il supporto PDF con:
- Caching dei prompt: Per migliorare le prestazioni per analisi ripetute.
- Elaborazione in batch: Per l’elaborazione di documenti ad alto volume.
- Uso di strumenti: Per estrarre informazioni specifiche dai documenti da utilizzare come input per strumenti.
Stima i tuoi costi
Il conteggio dei token di un file PDF dipende dal testo totale estratto dal documento e dal numero di pagine:
- Costi dei token di testo: Ogni pagina utilizza tipicamente 1.500-3.000 token per pagina a seconda della densità del contenuto. Si applica il prezzo standard dell’API senza costi aggiuntivi per i PDF.
- Costi dei token di immagine: Poiché ogni pagina viene convertita in un’immagine, vengono applicati gli stessi calcoli dei costi basati sulle immagini.
Puoi utilizzare il conteggio dei token per stimare i costi per i tuoi PDF specifici.
Ottimizza l’elaborazione dei PDF
Migliora le prestazioni
Segui queste best practice per risultati ottimali:
- Posiziona i PDF prima del testo nelle tue richieste
- Utilizza font standard
- Assicurati che il testo sia chiaro e leggibile
- Ruota le pagine nell’orientamento verticale corretto
- Usa numeri di pagina logici (dal visualizzatore PDF) nei prompt
- Dividi i PDF di grandi dimensioni in blocchi quando necessario
- Abilita il caching dei prompt per analisi ripetute
Scala la tua implementazione
Per l’elaborazione ad alto volume, considera questi approcci:
Usa il caching dei prompt
Memorizza nella cache i PDF per migliorare le prestazioni su query ripetute:
Elabora batch di documenti
Usa l’API Message Batches per flussi di lavoro ad alto volume: