Text-Embeddings sind numerische Darstellungen von Text, die es ermöglichen, semantische Ähnlichkeit zu messen. Dieser Leitfaden stellt Embeddings vor, ihre Anwendungen und wie man Embedding-Modelle für Aufgaben wie Suche, Empfehlungen und Anomalieerkennung verwendet.
Model | Context Length | Embedding Dimension | Description |
---|---|---|---|
voyage-3-large | 32.000 | 1024 (Standard), 256, 512, 2048 | Die beste allgemeine und mehrsprachige Abrufqualität. |
voyage-3 | 32.000 | 1024 | Optimiert für allgemeine und mehrsprachige Abrufqualität. Siehe Blog-Beitrag für Details. |
voyage-3-lite | 32.000 | 512 | Optimiert für Latenz und Kosten. Siehe Blog-Beitrag für Details. |
voyage-code-3 | 32.000 | 1024 (Standard), 256, 512, 2048 | Optimiert für Code-Abruf. Siehe Blog-Beitrag für Details. |
voyage-finance-2 | 32.000 | 1024 | Optimiert für Finanz-Abruf und RAG. Siehe Blog-Beitrag für Details. |
voyage-law-2 | 16.000 | 1024 | Optimiert für juristische und lange Kontext-Abruf und RAG. Auch verbesserte Leistung über alle Domänen hinweg. Siehe Blog-Beitrag für Details. |
Model | Context Length | Embedding Dimension | Description |
---|---|---|---|
voyage-multimodal-3 | 32000 | 1024 | Reichhaltiges multimodales Embedding-Modell, das verschachtelte Texte und inhaltsreiche Bilder wie Screenshots von PDFs, Präsentationen, Tabellen, Abbildungen und mehr vektorisieren kann. Siehe Blog-Beitrag für Details. |
voyageai
Python-Paket oder HTTP-Anfragen erhalten, wie unten beschrieben.
voyageai
-Paket kann mit folgendem Befehl installiert werden:
result.embeddings
wird eine Liste von zwei Embedding-Vektoren sein, die jeweils 1024 Fließkommazahlen enthalten. Nach Ausführung des obigen Codes werden die beiden Embeddings auf dem Bildschirm ausgegeben:
embed()
-Funktion angeben. Hier können Sie mehr über die Spezifikation lesen
curl
-Befehl in einem Terminal senden:
input_type="document"
und input_type="query"
für das Einbetten des Dokuments bzw. der Anfrage verwenden. Weitere Spezifikationen finden Sie hier.
Die Ausgabe wäre das 5. Dokument, das tatsächlich am relevantesten für die Anfrage ist:
Warum haben Voyage Embeddings überlegene Qualität?
Welche Embedding-Modelle sind verfügbar und welches sollte ich verwenden?
voyage-3-large
: Beste Qualitätvoyage-3-lite
: Niedrigste Latenz und Kostenvoyage-3
: Ausgewogene Leistung mit überlegener Abrufqualität zu einem wettbewerbsfähigen Preisinput_type
-Parameter, um den Abfrage- oder Dokumenttyp anzugeben.Domänenspezifische Modelle:voyage-law-2
voyage-code-3
voyage-finance-2
Welche Ähnlichkeitsfunktion sollte ich verwenden?
Wie sollte ich den input_type Parameter verwenden?
input_type
als “query” oder “document” an. Diese Optimierung verbessert die Abrufqualität durch spezialisierte Prompt-Präfixierung:Für Abfragen:input_type
niemals weg oder setzen Sie es für Abrufaufgaben nicht auf None
.voyage-large-2-instruct
, folgen Sie den Anweisungen in unserem GitHub Repository.Welche Quantisierungsoptionen sind verfügbar?
output_dtype
):Typ | Beschreibung | Größenreduzierung |
---|---|---|
float | 32-Bit Einfachpräzisions-Fließkommazahl (Standard) | Keine |
int8 /uint8 | 8-Bit Ganzzahlen (-128 bis 127 / 0 bis 255) | 4x |
binary /ubinary | Bit-gepackte Einzelbit-Werte | 32x |
binary
die Offset-Binärmethode verwendet.Wie kann ich Matryoshka Embeddings kürzen?