Supporto PDF (beta)
I modelli Claude 3.5 Sonnet ora supportano l’input PDF e comprendono sia il testo che il contenuto visivo all’interno dei documenti.
Il supporto PDF è in beta pubblica
Per accedere a questa funzionalità, includi l’header anthropic-beta: pdfs-2024-09-25
nelle tue richieste API.
Continueremo a iterare su questa beta aperta nelle prossime settimane, quindi apprezziamo il tuo feedback. Condividi le tue idee e suggerimenti utilizzando questo modulo.
Capacità PDF
Claude lavora con qualsiasi PDF standard. Puoi chiedere a Claude informazioni su qualsiasi testo, immagine, grafico e tabella nei PDF che fornisci. Alcuni casi d’uso di esempio:
- Analisi di report finanziari e comprensione di grafici/tabelle
- Estrazione di informazioni chiave da documenti legali
- Assistenza alla traduzione per documenti
- Conversione di informazioni dei documenti in formati strutturati
Come funziona il supporto PDF
Quando invii una richiesta che include un file PDF:
Il sistema estrae i contenuti del documento.
- Il sistema converte ogni pagina del documento in un’immagine.
- Il testo di ogni pagina viene estratto e fornito insieme all’immagine della pagina.
Claude analizza sia il testo che le immagini per comprendere meglio il documento.
- I documenti vengono forniti come una combinazione di testo e immagini per l’analisi.
- Questo permette agli utenti di chiedere approfondimenti sugli elementi visivi di un PDF, come grafici, diagrammi e altri contenuti non testuali.
Usa i documenti insieme ad altre funzionalità di Claude.
Il supporto PDF funziona bene insieme a:
- Caching dei prompt: Per migliorare le prestazioni per analisi ripetute.
- Elaborazione batch: Per l’elaborazione di documenti ad alto volume.
- Uso degli strumenti: Per estrarre informazioni specifiche dai documenti da utilizzare come input per gli strumenti.
Limitazioni del supporto PDF
Prima di integrare il supporto PDF nella tua applicazione, assicurati che i tuoi file soddisfino questi requisiti:
Requisito | Limite |
---|---|
Dimensione massima della richiesta | 32MB |
Pagine massime per richiesta | 100 |
Modelli supportati | claude-3-5-sonnet-20241022 , claude-3-5-sonnet-20240620 |
Si noti che entrambi i limiti si applicano all’intero payload della richiesta, incluso qualsiasi altro contenuto inviato insieme ai PDF. I PDF forniti non devono avere password o crittografia.
Poiché il supporto PDF si basa sulle capacità di visione di Claude, è soggetto alle stesse limitazioni.
Piattaforme e modelli supportati
Il supporto PDF è attualmente disponibile su entrambi i modelli Claude 3.5 Sonnet (claude-3-5-sonnet-20241022
, claude-3-5-sonnet-20240620
) tramite accesso diretto all’API. Questa funzionalità sarà presto supportata su Amazon Bedrock e Google Vertex AI.
Calcola l’utilizzo previsto dei token
Il conteggio dei token di un file PDF dipende dal testo totale estratto dal documento e dal numero di pagine. Poiché ogni pagina viene convertita in un’immagine, vengono applicati gli stessi calcoli dei costi basati sulle immagini. Ogni pagina utilizza tipicamente da 1.500 a 3.000 token, a seconda della densità del contenuto. Si applica il prezzo standard dei token di input, senza costi aggiuntivi per l’elaborazione PDF.
Puoi anche utilizzare il conteggio dei token per determinare il numero di token in un messaggio contenente PDF.
Come utilizzare i PDF nell’API Messages
Ecco un esempio semplice che dimostra come utilizzare i PDF nell’API Messages:
Ecco alcuni altri esempi per aiutarti a iniziare:
Migliori pratiche per l’analisi PDF
- Assicurati che il testo sia chiaro e leggibile.
- Ruota le pagine nell’orientamento corretto.
- Quando fai riferimento ai numeri di pagina, usa il numero logico (il numero riportato dal tuo visualizzatore PDF) piuttosto che il numero di pagina fisico (il numero visibile sulla pagina)
- Usa font standard.
- Posiziona i PDF prima del testo nelle richieste.
- Dividi i PDF molto grandi in parti più piccole quando vengono superati i limiti.
- Usa il caching dei prompt per l’analisi ripetuta dello stesso documento.
Prossimi passi
Pronto per iniziare a lavorare con i PDF usando Claude? Ecco alcune risorse utili: