Il supporto PDF è in beta pubblica

Per accedere a questa funzionalità, includi l’header anthropic-beta: pdfs-2024-09-25 nelle tue richieste API.

Continueremo a iterare su questa beta aperta nelle prossime settimane, quindi apprezziamo il tuo feedback. Condividi le tue idee e suggerimenti utilizzando questo modulo.


Capacità PDF

Claude lavora con qualsiasi PDF standard. Puoi chiedere a Claude informazioni su qualsiasi testo, immagine, grafico e tabella nei PDF che fornisci. Alcuni casi d’uso di esempio:

  • Analisi di report finanziari e comprensione di grafici/tabelle
  • Estrazione di informazioni chiave da documenti legali
  • Assistenza alla traduzione per documenti
  • Conversione di informazioni dei documenti in formati strutturati

Come funziona il supporto PDF

Quando invii una richiesta che include un file PDF:

1

Il sistema estrae i contenuti del documento.

  • Il sistema converte ogni pagina del documento in un’immagine.
  • Il testo di ogni pagina viene estratto e fornito insieme all’immagine della pagina.
2

Claude analizza sia il testo che le immagini per comprendere meglio il documento.

  • I documenti vengono forniti come una combinazione di testo e immagini per l’analisi.
  • Questo permette agli utenti di chiedere approfondimenti sugli elementi visivi di un PDF, come grafici, diagrammi e altri contenuti non testuali.
3

Usa i documenti insieme ad altre funzionalità di Claude.

Il supporto PDF funziona bene insieme a:

  • Caching dei prompt: Per migliorare le prestazioni per analisi ripetute.
  • Elaborazione batch: Per l’elaborazione di documenti ad alto volume.
  • Uso degli strumenti: Per estrarre informazioni specifiche dai documenti da utilizzare come input per gli strumenti.

Limitazioni del supporto PDF

Prima di integrare il supporto PDF nella tua applicazione, assicurati che i tuoi file soddisfino questi requisiti:

RequisitoLimite
Dimensione massima della richiesta32MB
Pagine massime per richiesta100
Modelli supportaticlaude-3-5-sonnet-20241022, claude-3-5-sonnet-20240620

Si noti che entrambi i limiti si applicano all’intero payload della richiesta, incluso qualsiasi altro contenuto inviato insieme ai PDF. I PDF forniti non devono avere password o crittografia.

Poiché il supporto PDF si basa sulle capacità di visione di Claude, è soggetto alle stesse limitazioni.

Piattaforme e modelli supportati

Il supporto PDF è attualmente disponibile su entrambi i modelli Claude 3.5 Sonnet (claude-3-5-sonnet-20241022, claude-3-5-sonnet-20240620) tramite accesso diretto all’API. Questa funzionalità sarà presto supportata su Amazon Bedrock e Google Vertex AI.

Calcola l’utilizzo previsto dei token

Il conteggio dei token di un file PDF dipende dal testo totale estratto dal documento e dal numero di pagine. Poiché ogni pagina viene convertita in un’immagine, vengono applicati gli stessi calcoli dei costi basati sulle immagini. Ogni pagina utilizza tipicamente da 1.500 a 3.000 token, a seconda della densità del contenuto. Si applica il prezzo standard dei token di input, senza costi aggiuntivi per l’elaborazione PDF.

Puoi anche utilizzare il conteggio dei token per determinare il numero di token in un messaggio contenente PDF.


Come utilizzare i PDF nell’API Messages

Ecco un esempio semplice che dimostra come utilizzare i PDF nell’API Messages:

Ecco alcuni altri esempi per aiutarti a iniziare:


Migliori pratiche per l’analisi PDF

  • Assicurati che il testo sia chiaro e leggibile.
  • Ruota le pagine nell’orientamento corretto.
  • Quando fai riferimento ai numeri di pagina, usa il numero logico (il numero riportato dal tuo visualizzatore PDF) piuttosto che il numero di pagina fisico (il numero visibile sulla pagina)
  • Usa font standard.
  • Posiziona i PDF prima del testo nelle richieste.
  • Dividi i PDF molto grandi in parti più piccole quando vengono superati i limiti.
  • Usa il caching dei prompt per l’analisi ripetuta dello stesso documento.

Prossimi passi

Pronto per iniziare a lavorare con i PDF usando Claude? Ecco alcune risorse utili: