Embeddings teks adalah representasi numerik dari teks yang memungkinkan pengukuran kesamaan semantik. Panduan ini memperkenalkan embeddings, aplikasinya, dan cara menggunakan model embedding untuk tugas-tugas seperti pencarian, rekomendasi, dan deteksi anomali.
Model | Panjang Konteks | Dimensi Embedding | Deskripsi |
---|---|---|---|
voyage-3-large | 32.000 | 1024 (default), 256, 512, 2048 | Kualitas pengambilan terbaik untuk tujuan umum dan multibahasa. |
voyage-3 | 32.000 | 1024 | Dioptimalkan untuk kualitas pengambilan tujuan umum dan multibahasa. Lihat blog post untuk detailnya. |
voyage-3-lite | 32.000 | 512 | Dioptimalkan untuk latensi dan biaya. Lihat blog post untuk detailnya. |
voyage-code-3 | 32.000 | 1024 (default), 256, 512, 2048 | Dioptimalkan untuk pengambilan kode. Lihat blog post untuk detailnya. |
voyage-finance-2 | 32.000 | 1024 | Dioptimalkan untuk pengambilan keuangan dan RAG. Lihat blog post untuk detailnya. |
voyage-law-2 | 16.000 | 1024 | Dioptimalkan untuk pengambilan dan RAG hukum dan konteks panjang. Juga meningkatkan kinerja di semua domain. Lihat blog post untuk detailnya. |
Model | Panjang Konteks | Dimensi Embedding | Deskripsi |
---|---|---|---|
voyage-multimodal-3 | 32000 | 1024 | Model embedding multimodal yang kaya yang dapat memvektorisasi teks dan gambar kaya konten yang saling terkait, seperti tangkapan layar PDF, slide, tabel, gambar, dan lainnya. Lihat blog post untuk detailnya. |
voyageai
atau permintaan HTTP, seperti yang dijelaskan di bawah ini.
voyageai
dapat diinstal menggunakan perintah berikut:
result.embeddings
akan menjadi daftar dua vektor embedding, masing-masing berisi 1024 angka floating-point. Setelah menjalankan kode di atas, kedua embedding akan dicetak di layar:
embed()
. Anda dapat membaca lebih lanjut tentang spesifikasinya di sini
curl
di terminal:
input_type="document"
dan input_type="query"
untuk masing-masing embedding dokumen dan query. Spesifikasi lebih lanjut dapat ditemukan di sini.
Outputnya akan menjadi dokumen ke-5, yang memang paling relevan dengan query:
Mengapa embeddings Voyage memiliki kualitas superior?
Model embedding apa saja yang tersedia dan mana yang harus saya gunakan?
voyage-3-large
: Kualitas terbaikvoyage-3-lite
: Latensi dan biaya terendahvoyage-3
: Performa seimbang dengan kualitas pengambilan superior pada harga yang kompetitifinput_type
untuk menentukan jenis query atau dokumen.Model domain spesifik:voyage-law-2
voyage-code-3
voyage-finance-2
Fungsi kesamaan mana yang harus saya gunakan?
Bagaimana saya harus menggunakan parameter input_type?
input_type
sebagai “query” atau “document”. Optimasi ini meningkatkan kualitas pengambilan melalui prefiks prompt khusus:Untuk query:input_type
atau mengaturnya ke None
untuk tugas pengambilan.voyage-large-2-instruct
, ikuti instruksi di repositori GitHub kami.Opsi kuantisasi apa saja yang tersedia?
output_dtype
):Tipe | Deskripsi | Pengurangan Ukuran |
---|---|---|
float | Floating-point presisi tunggal 32-bit (default) | Tidak ada |
int8 /uint8 | Integer 8-bit (-128 hingga 127 / 0 hingga 255) | 4x |
binary /ubinary | Nilai bit tunggal yang di-pack | 32x |
binary
menggunakan metode binary offset.Bagaimana cara memotong embeddings Matryoshka?