Ora puoi chiedere a Claude informazioni su qualsiasi testo, immagine, grafico e tabella nei PDF che fornisci. Alcuni casi d’uso di esempio:

  • Analisi di report finanziari e comprensione di grafici/tabelle
  • Estrazione di informazioni chiave da documenti legali
  • Assistenza alla traduzione per documenti
  • Conversione di informazioni dei documenti in formati strutturati

Prima di iniziare

Verifica i requisiti PDF

Claude funziona con qualsiasi PDF standard. Tuttavia, dovresti assicurarti che le dimensioni della tua richiesta soddisfino questi requisiti quando utilizzi il supporto PDF:

RequisitoLimite
Dimensione massima richiesta32MB
Pagine massime per richiesta100
FormatoPDF standard (senza password/crittografia)

Si noti che entrambi i limiti si applicano all’intero payload della richiesta, incluso qualsiasi altro contenuto inviato insieme ai PDF.

Poiché il supporto PDF si basa sulle capacità di visione di Claude, è soggetto alle stesse limitazioni e considerazioni di altri compiti di visione.

Piattaforme e modelli supportati

Il supporto PDF è attualmente disponibile su entrambi i modelli Claude 3.5 Sonnet (claude-3-5-sonnet-20241022, claude-3-5-sonnet-20240620) tramite accesso diretto alle API. Questa funzionalità sarà presto supportata su Amazon Bedrock e Google Vertex AI


Elabora PDF con Claude

Invia la tua prima richiesta PDF

Iniziamo con un semplice esempio utilizzando l’API Messages:

Come funziona il supporto PDF

Quando invii un PDF a Claude, si verificano i seguenti passaggi:

1

Il sistema estrae i contenuti del documento.

  • Il sistema converte ogni pagina del documento in un’immagine.
  • Il testo di ogni pagina viene estratto e fornito insieme all’immagine della pagina.
2

Claude analizza sia il testo che le immagini per comprendere meglio il documento.

  • I documenti vengono forniti come una combinazione di testo e immagini per l’analisi.
  • Questo permette agli utenti di chiedere informazioni sugli elementi visivi di un PDF, come grafici, diagrammi e altri contenuti non testuali.
3

Claude risponde, facendo riferimento ai contenuti del PDF se pertinente.

Claude può fare riferimento sia ai contenuti testuali che visivi quando risponde. Puoi migliorare ulteriormente le prestazioni integrando il supporto PDF con:

  • Cache delle prompt: Per migliorare le prestazioni per analisi ripetute.
  • Elaborazione batch: Per l’elaborazione di documenti ad alto volume.
  • Uso di strumenti: Per estrarre informazioni specifiche dai documenti da utilizzare come input per gli strumenti.

Stima i tuoi costi

Il conteggio dei token di un file PDF dipende dal testo totale estratto dal documento e dal numero di pagine:

  • Costi dei token di testo: Ogni pagina utilizza tipicamente 1.500-3.000 token per pagina a seconda della densità del contenuto. Si applica il prezzo API standard senza costi aggiuntivi per PDF.
  • Costi dei token immagine: Poiché ogni pagina viene convertita in un’immagine, vengono applicati gli stessi calcoli dei costi basati sulle immagini.

Puoi utilizzare il conteggio dei token per stimare i costi per i tuoi PDF specifici.


Ottimizza l’elaborazione PDF

Migliora le prestazioni

Segui queste best practice per risultati ottimali:

  • Posiziona i PDF prima del testo nelle tue richieste
  • Usa font standard
  • Assicurati che il testo sia chiaro e leggibile
  • Ruota le pagine nel corretto orientamento verticale
  • Usa numeri di pagina logici (dal visualizzatore PDF) nelle prompt
  • Dividi i PDF grandi in blocchi quando necessario
  • Abilita la cache delle prompt per analisi ripetute

Scala la tua implementazione

Per l’elaborazione ad alto volume, considera questi approcci:

Usa la cache delle prompt

Memorizza in cache i PDF per migliorare le prestazioni su query ripetute:

Elabora batch di documenti

Usa l’API Message Batches per flussi di lavoro ad alto volume:

Prossimi passi