Embeddings
Gli embeddings di testo sono rappresentazioni numeriche del testo che consentono di misurare la similarità semantica. Questa guida introduce gli embeddings, le loro applicazioni e come utilizzare i modelli di embedding per attività come ricerca, raccomandazioni e rilevamento di anomalie.
Prima di implementare gli embeddings
Quando si seleziona un provider di embeddings, ci sono diversi fattori da considerare in base alle proprie esigenze e preferenze:
- Dimensione del dataset e specificità del dominio: dimensione del dataset di addestramento del modello e la sua rilevanza per il dominio che si desidera incorporare. Dati più ampi o più specifici del dominio generalmente producono migliori embeddings nel dominio
- Prestazioni di inferenza: velocità di ricerca degli embedding e latenza end-to-end. Questa è una considerazione particolarmente importante per implementazioni in produzione su larga scala
- Personalizzazione: opzioni per continuare l’addestramento su dati privati o specializzazione dei modelli per domini molto specifici. Questo può migliorare le prestazioni su vocabolari unici
Come ottenere embeddings con Anthropic
Anthropic non offre un proprio modello di embedding. Un provider di embeddings che ha un’ampia varietà di opzioni e capacità che comprendono tutte le considerazioni di cui sopra è Voyage AI.
Voyage AI realizza modelli di embedding all’avanguardia e offre modelli personalizzati per specifici domini industriali come finanza e sanità, o modelli su misura perfezionati per singoli clienti.
Il resto di questa guida è per Voyage AI, ma ti incoraggiamo a valutare una varietà di fornitori di embeddings per trovare quello più adatto al tuo caso d’uso specifico.
Modelli Disponibili
Voyage raccomanda l’utilizzo dei seguenti modelli di embedding del testo:
Modello | Lunghezza del Contesto | Dimensione dell’Embedding | Descrizione |
---|---|---|---|
voyage-3-large | 32.000 | 1024 (predefinito), 256, 512, 2048 | La migliore qualità di recupero per uso generale e multilingue. |
voyage-3 | 32.000 | 1024 | Ottimizzato per qualità di recupero per uso generale e multilingue. Vedi il post sul blog per i dettagli. |
voyage-3-lite | 32.000 | 512 | Ottimizzato per latenza e costo. Vedi il post sul blog per i dettagli. |
voyage-code-3 | 32.000 | 1024 (predefinito), 256, 512, 2048 | Ottimizzato per il recupero di codice. Vedi il post sul blog per i dettagli. |
voyage-finance-2 | 32.000 | 1024 | Ottimizzato per il recupero e RAG in ambito finanziario. Vedi il post sul blog per i dettagli. |
voyage-law-2 | 16.000 | 1024 | Ottimizzato per il recupero e RAG legale e contesto lungo. Prestazioni migliorate anche in tutti i domini. Vedi il post sul blog per i dettagli. |
Inoltre, sono raccomandati i seguenti modelli di embedding multimodali:
Modello | Lunghezza del Contesto | Dimensione dell’Embedding | Descrizione |
---|---|---|---|
voyage-multimodal-3 | 32000 | 1024 | Modello di embedding multimodale ricco che può vettorializzare testo intervallato e immagini ricche di contenuto, come screenshot di PDF, diapositive, tabelle, figure e altro. Vedi il post sul blog per i dettagli. |
Hai bisogno di aiuto per decidere quale modello di embedding testuale utilizzare? Consulta le FAQ.
Iniziare con Voyage AI
Per accedere agli embeddings di Voyage:
- Registrati sul sito web di Voyage AI
- Ottieni una chiave API
- Imposta la chiave API come variabile d’ambiente per comodità:
Puoi ottenere gli embeddings utilizzando il pacchetto Python ufficiale voyageai
o le richieste HTTP, come descritto di seguito.
Pacchetto Python Voyage
Il pacchetto voyageai
può essere installato usando il seguente comando:
Quindi, puoi creare un oggetto client e iniziare a usarlo per incorporare i tuoi testi:
result.embeddings
sarà una lista di due vettori di embedding, ciascuno contenente 1024 numeri in virgola mobile. Dopo aver eseguito il codice sopra, i due embeddings verranno stampati sullo schermo:
Quando crei gli embeddings, puoi anche specificare alcuni altri argomenti alla funzione embed()
. Puoi leggere di più sulla specifica qui
API HTTP Voyage
Puoi anche ottenere embeddings richiedendo l’API HTTP di Voyage. Per esempio, puoi inviare una richiesta HTTP attraverso il comando curl
in un terminale:
La risposta che otterrai è un oggetto JSON contenente gli embeddings e l’utilizzo dei token:
Puoi leggere di più sull’endpoint di embedding nella documentazione di Voyage
AWS Marketplace
Gli embeddings di Voyage sono disponibili anche su AWS Marketplace. Le istruzioni per accedere a Voyage su AWS sono disponibili qui.
Esempio di Avvio Rapido
Ora che sappiamo come ottenere gli embeddings, vediamo un breve esempio.
Supponiamo di avere un piccolo corpus di sei documenti da cui recuperare
Prima useremo Voyage per convertire ciascuno di essi in un vettore di embedding
Gli embeddings ci permetteranno di fare ricerca semantica / recupero nello spazio vettoriale. Data una query di esempio,
la convertiamo in un embedding e conduciamo una ricerca del vicino più prossimo per trovare il documento più rilevante basato sulla distanza nello spazio degli embedding.
Nota che usiamo input_type="document"
e input_type="query"
per incorporare rispettivamente il documento e la query. Ulteriori specifiche possono essere trovate qui.
L’output sarà il 5° documento, che è effettivamente il più rilevante per la query:
Se stai cercando una serie dettagliata di guide su come fare RAG con gli embeddings, inclusi i database vettoriali, consulta il nostro cookbook RAG.
FAQ
Prezzi
Visita la pagina dei prezzi di Voyage per i dettagli più aggiornati sui prezzi.
Was this page helpful?