Citazioni
Claude è in grado di fornire citazioni dettagliate quando risponde a domande sui documenti, aiutandoti a tracciare e verificare le fonti di informazione nelle risposte.
Claude è in grado di fornire citazioni dettagliate quando risponde a domande sui documenti, aiutandoti a tracciare e verificare le fonti di informazione nelle risposte.
La funzione citazioni è attualmente disponibile su Claude Opus 4, Claude Sonnet 4, Claude Sonnet 3.7, Claude Sonnet 3.5 (nuovo) e Haiku 3.5.
Citazioni con Claude Sonnet 3.7
Claude Sonnet 3.7 potrebbe essere meno propenso a fare citazioni rispetto ad altri modelli Claude senza istruzioni più esplicite da parte dell’utente. Quando usi le citazioni con Claude Sonnet 3.7, raccomandiamo di includere istruzioni aggiuntive nel turno user
, come "Usa le citazioni per supportare la tua risposta."
per esempio.
Abbiamo anche osservato che quando al modello viene chiesto di strutturare la sua risposta, è improbabile che usi le citazioni a meno che non gli venga esplicitamente detto di usare le citazioni all’interno di quel formato. Per esempio, se al modello viene chiesto di usare i tag
Ti preghiamo di condividere i tuoi feedback e suggerimenti sulla funzione citazioni usando questo modulo.
Ecco un esempio di come usare le citazioni con l’API Messages:
Confronto con approcci basati su prompt
In confronto alle soluzioni di citazioni basate su prompt, la funzione citazioni ha i seguenti vantaggi:
- Risparmio sui costi: Se il tuo approccio basato su prompt chiede a Claude di produrre citazioni dirette, potresti vedere risparmi sui costi dovuti al fatto che
cited_text
non conta verso i tuoi token di output. - Migliore affidabilità delle citazioni: Poiché analizziamo le citazioni nei rispettivi formati di risposta menzionati sopra ed estraiamo
cited_text
, le citazioni sono garantite per contenere puntatori validi ai documenti forniti. - Qualità delle citazioni migliorata: Nelle nostre valutazioni, abbiamo trovato che la funzione citazioni è significativamente più probabile che citi le citazioni più rilevanti dai documenti rispetto agli approcci puramente basati su prompt.
Come funzionano le citazioni
Integra le citazioni con Claude in questi passaggi:
Fornisci documento/i e abilita le citazioni
- Includi documenti in uno qualsiasi dei formati supportati: PDF, testo semplice, o documenti di contenuto personalizzato
- Imposta
citations.enabled=true
su ciascuno dei tuoi documenti. Attualmente, le citazioni devono essere abilitate su tutti o nessuno dei documenti all’interno di una richiesta. - Nota che attualmente sono supportate solo le citazioni di testo e le citazioni di immagini non sono ancora possibili.
I documenti vengono elaborati
- I contenuti dei documenti vengono “suddivisi in blocchi” per definire la granularità minima delle possibili citazioni. Per esempio, la suddivisione in frasi permetterebbe a Claude di citare una singola frase o concatenare più frasi consecutive per citare un paragrafo (o più lungo)!
- Per i PDF: Il testo viene estratto come descritto in Supporto PDF e il contenuto viene suddiviso in frasi. Citare immagini dai PDF non è attualmente supportato.
- Per i documenti di testo semplice: Il contenuto viene suddiviso in frasi che possono essere citate.
- Per i documenti di contenuto personalizzato: I tuoi blocchi di contenuto forniti vengono usati così come sono e non viene fatta ulteriore suddivisione.
Claude fornisce una risposta citata
- Le risposte ora possono includere più blocchi di testo dove ogni blocco di testo può contenere un’affermazione che Claude sta facendo e un elenco di citazioni che supportano l’affermazione.
- Le citazioni fanno riferimento a posizioni specifiche nei documenti sorgente. Il formato di queste citazioni dipende dal tipo di documento da cui si sta citando.
- Per i PDF: le citazioni includeranno l’intervallo del numero di pagina (indicizzato da 1).
- Per i documenti di testo semplice: Le citazioni includeranno l’intervallo dell’indice dei caratteri (indicizzato da 0).
- Per i documenti di contenuto personalizzato: Le citazioni includeranno l’intervallo dell’indice del blocco di contenuto (indicizzato da 0) corrispondente all’elenco di contenuti originale fornito.
- Gli indici dei documenti vengono forniti per indicare la sorgente di riferimento e sono indicizzati da 0 secondo l’elenco di tutti i documenti nella tua richiesta originale.
Suddivisione automatica vs contenuto personalizzato
Per impostazione predefinita, i documenti di testo semplice e PDF vengono automaticamente suddivisi in frasi. Se hai bisogno di più controllo sulla granularità delle citazioni (ad es., per punti elenco o trascrizioni), usa invece documenti di contenuto personalizzato. Vedi Tipi di Documento per maggiori dettagli.
Per esempio, se vuoi che Claude sia in grado di citare frasi specifiche dai tuoi blocchi RAG, dovresti mettere ogni blocco RAG in un documento di testo semplice. Altrimenti, se non vuoi che venga fatta ulteriore suddivisione, o se vuoi personalizzare qualsiasi suddivisione aggiuntiva, puoi mettere i blocchi RAG in documento/i di contenuto personalizzato.
Contenuto citabile vs non citabile
- Il testo trovato all’interno del contenuto
source
di un documento può essere citato. title
econtext
sono campi opzionali che verranno passati al modello ma non usati per il contenuto citato.title
è limitato in lunghezza quindi potresti trovare utile il campocontext
per memorizzare qualsiasi metadato del documento come testo o json stringificato.
Indici delle citazioni
- Gli indici dei documenti sono indicizzati da 0 dall’elenco di tutti i blocchi di contenuto del documento nella richiesta (che si estende attraverso tutti i messaggi).
- Gli indici dei caratteri sono indicizzati da 0 con indici di fine esclusivi.
- I numeri di pagina sono indicizzati da 1 con numeri di pagina di fine esclusivi.
- Gli indici dei blocchi di contenuto sono indicizzati da 0 con indici di fine esclusivi dall’elenco
content
fornito nel documento di contenuto personalizzato.
Costi dei token
- Abilitare le citazioni comporta un leggero aumento nei token di input dovuto alle aggiunte del prompt di sistema e alla suddivisione dei documenti.
- Tuttavia, la funzione citazioni è molto efficiente con i token di output. Sotto il cofano, il modello sta producendo citazioni in un formato standardizzato che vengono poi analizzate in testo citato e indici di posizione del documento. Il campo
cited_text
viene fornito per comodità e non conta verso i token di output. - Quando passato indietro nei turni di conversazione successivi,
cited_text
non viene nemmeno contato verso i token di input.
Compatibilità delle funzioni
Le citazioni funzionano insieme ad altre funzioni API inclusi prompt caching, conteggio token e elaborazione batch.
Usare il Prompt Caching con le Citazioni
Le citazioni e il prompt caching possono essere usati insieme efficacemente.
I blocchi di citazione generati nelle risposte non possono essere memorizzati nella cache direttamente, ma i documenti sorgente a cui fanno riferimento possono essere memorizzati nella cache. Per ottimizzare le prestazioni, applica cache_control
ai tuoi blocchi di contenuto del documento di livello superiore.
In questo esempio:
- Il contenuto del documento viene memorizzato nella cache usando
cache_control
sul blocco del documento - Le citazioni sono abilitate sul documento
- Claude può generare risposte con citazioni mentre beneficia del contenuto del documento memorizzato nella cache
- Le richieste successive che usano lo stesso documento beneficeranno del contenuto memorizzato nella cache
Tipi di Documento
Scegliere un tipo di documento
Supportiamo tre tipi di documento per le citazioni. I documenti possono essere forniti direttamente nel messaggio (base64, testo, o URL) o caricati tramite l’API Files e referenziati per file_id
:
Tipo | Migliore per | Suddivisione | Formato citazione |
---|---|---|---|
Testo semplice | Documenti di testo semplici, prosa | Frase | Indici caratteri (indicizzati da 0) |
File PDF con contenuto testuale | Frase | Numeri pagina (indicizzati da 1) | |
Contenuto personalizzato | Elenchi, trascrizioni, formattazione speciale, citazioni più granulari | Nessuna suddivisione aggiuntiva | Indici blocchi (indicizzati da 0) |
I file .csv, .xlsx, .docx, .md, e .txt non sono supportati come blocchi documento. Converti questi in testo semplice e includi direttamente nel contenuto del messaggio. Vedi Lavorare con altri formati di file.
Documenti di testo semplice
I documenti di testo semplice vengono automaticamente suddivisi in frasi. Puoi fornirli inline o per riferimento con il loro file_id
:
Documenti PDF
I documenti PDF possono essere forniti come dati codificati in base64 o per file_id
. Il testo PDF viene estratto e suddiviso in frasi. Poiché le citazioni di immagini non sono ancora supportate, i PDF che sono scansioni di documenti e non contengono testo estraibile non saranno citabili.
Documenti di contenuto personalizzato
I documenti di contenuto personalizzato ti danno controllo sulla granularità delle citazioni. Non viene fatta suddivisione aggiuntiva e i blocchi vengono forniti al modello secondo i blocchi di contenuto forniti.
Struttura della Risposta
Quando le citazioni sono abilitate, le risposte includono più blocchi di testo con citazioni:
Supporto Streaming
Per le risposte in streaming, abbiamo aggiunto un tipo citations_delta
che contiene una singola citazione da aggiungere all’elenco citations
sul blocco di contenuto text
corrente.