Gli embeddings di testo sono rappresentazioni numeriche del testo che consentono di misurare la similarità semantica. Questa guida introduce gli embeddings, le loro applicazioni e come utilizzare i modelli di embedding per attività come ricerca, raccomandazioni e rilevamento di anomalie.
Modello | Lunghezza del Contesto | Dimensione dell’Embedding | Descrizione |
---|---|---|---|
voyage-3-large | 32.000 | 1024 (predefinito), 256, 512, 2048 | La migliore qualità di recupero per uso generale e multilingue. |
voyage-3 | 32.000 | 1024 | Ottimizzato per qualità di recupero per uso generale e multilingue. Vedi il post sul blog per i dettagli. |
voyage-3-lite | 32.000 | 512 | Ottimizzato per latenza e costo. Vedi il post sul blog per i dettagli. |
voyage-code-3 | 32.000 | 1024 (predefinito), 256, 512, 2048 | Ottimizzato per il recupero di codice. Vedi il post sul blog per i dettagli. |
voyage-finance-2 | 32.000 | 1024 | Ottimizzato per il recupero e RAG in ambito finanziario. Vedi il post sul blog per i dettagli. |
voyage-law-2 | 16.000 | 1024 | Ottimizzato per il recupero e RAG legale e contesto lungo. Prestazioni migliorate anche in tutti i domini. Vedi il post sul blog per i dettagli. |
Modello | Lunghezza del Contesto | Dimensione dell’Embedding | Descrizione |
---|---|---|---|
voyage-multimodal-3 | 32000 | 1024 | Modello di embedding multimodale ricco che può vettorializzare testo intervallato e immagini ricche di contenuto, come screenshot di PDF, diapositive, tabelle, figure e altro. Vedi il post sul blog per i dettagli. |
voyageai
o le richieste HTTP, come descritto di seguito.
voyageai
può essere installato usando il seguente comando:
result.embeddings
sarà una lista di due vettori di embedding, ciascuno contenente 1024 numeri in virgola mobile. Dopo aver eseguito il codice sopra, i due embeddings verranno stampati sullo schermo:
embed()
. Puoi leggere di più sulla specifica qui
curl
in un terminale:
input_type="document"
e input_type="query"
per incorporare rispettivamente il documento e la query. Ulteriori specifiche possono essere trovate qui.
L’output sarà il 5° documento, che è effettivamente il più rilevante per la query:
Perché gli embeddings di Voyage hanno una qualità superiore?
Quali modelli di embedding sono disponibili e quale dovrei usare?
voyage-3-large
: Migliore qualitàvoyage-3-lite
: Minima latenza e costovoyage-3
: Prestazioni bilanciate con qualità di recupero superiore a un prezzo competitivoinput_type
per specificare il tipo di query o documento.Modelli specifici per dominio:voyage-law-2
voyage-code-3
voyage-finance-2
Quale funzione di similarità dovrei usare?
Come dovrei usare il parametro input_type?
input_type
come “query” o “document”. Questa ottimizzazione migliora la qualità del recupero attraverso il prefissaggio specializzato dei prompt:Per le query:input_type
o impostarlo su None
per le attività di recupero.voyage-large-2-instruct
, segui le istruzioni nel nostro repository GitHub.Quali opzioni di quantizzazione sono disponibili?
output_dtype
):Tipo | Descrizione | Riduzione Dimensione |
---|---|---|
float | Virgola mobile a precisione singola a 32 bit (predefinito) | Nessuna |
int8 /uint8 | Interi a 8 bit (-128 a 127 / 0 a 255) | 4x |
binary /ubinary | Valori a singolo bit impacchettati | 32x |
binary
che usa il metodo binario con offset.Come posso troncare gli embeddings Matryoshka?