Embeddings
Embeddings teks adalah representasi numerik dari teks yang memungkinkan pengukuran kesamaan semantik. Panduan ini memperkenalkan embeddings, aplikasinya, dan cara menggunakan model embedding untuk tugas-tugas seperti pencarian, rekomendasi, dan deteksi anomali.
Sebelum mengimplementasikan embeddings
Saat memilih penyedia embeddings, ada beberapa faktor yang dapat Anda pertimbangkan tergantung pada kebutuhan dan preferensi Anda:
- Ukuran dataset & spesifisitas domain: ukuran dataset pelatihan model dan relevansinya dengan domain yang ingin Anda embed. Data yang lebih besar atau lebih spesifik domain umumnya menghasilkan embeddings dalam domain yang lebih baik
- Performa inferensi: kecepatan pencarian embedding dan latensi end-to-end. Ini adalah pertimbangan yang sangat penting untuk deployment produksi skala besar
- Kustomisasi: opsi untuk melanjutkan pelatihan pada data pribadi, atau spesialisasi model untuk domain yang sangat spesifik. Ini dapat meningkatkan kinerja pada kosakata yang unik
Cara mendapatkan embeddings dengan Anthropic
Anthropic tidak menawarkan model embedding sendiri. Salah satu penyedia embeddings yang memiliki berbagai pilihan dan kemampuan yang mencakup semua pertimbangan di atas adalah Voyage AI.
Voyage AI membuat model embedding mutakhir dan menawarkan model yang disesuaikan untuk domain industri tertentu seperti keuangan dan kesehatan, atau model yang disesuaikan khusus untuk pelanggan individual.
Sisa panduan ini adalah untuk Voyage AI, tetapi kami mendorong Anda untuk menilai berbagai vendor embeddings untuk menemukan yang paling sesuai dengan kasus penggunaan spesifik Anda.
Model yang Tersedia
Voyage merekomendasikan penggunaan model embedding teks berikut:
Model | Panjang Konteks | Dimensi Embedding | Deskripsi |
---|---|---|---|
voyage-3-large | 32.000 | 1024 (default), 256, 512, 2048 | Kualitas pengambilan terbaik untuk tujuan umum dan multibahasa. |
voyage-3 | 32.000 | 1024 | Dioptimalkan untuk kualitas pengambilan tujuan umum dan multibahasa. Lihat blog post untuk detailnya. |
voyage-3-lite | 32.000 | 512 | Dioptimalkan untuk latensi dan biaya. Lihat blog post untuk detailnya. |
voyage-code-3 | 32.000 | 1024 (default), 256, 512, 2048 | Dioptimalkan untuk pengambilan kode. Lihat blog post untuk detailnya. |
voyage-finance-2 | 32.000 | 1024 | Dioptimalkan untuk pengambilan keuangan dan RAG. Lihat blog post untuk detailnya. |
voyage-law-2 | 16.000 | 1024 | Dioptimalkan untuk pengambilan dan RAG hukum dan konteks panjang. Juga meningkatkan kinerja di semua domain. Lihat blog post untuk detailnya. |
Selain itu, model embedding multimodal berikut direkomendasikan:
Model | Panjang Konteks | Dimensi Embedding | Deskripsi |
---|---|---|---|
voyage-multimodal-3 | 32000 | 1024 | Model embedding multimodal yang kaya yang dapat memvektorisasi teks dan gambar kaya konten yang saling terkait, seperti tangkapan layar PDF, slide, tabel, gambar, dan lainnya. Lihat blog post untuk detailnya. |
Butuh bantuan memutuskan model embedding teks mana yang akan digunakan? Lihat FAQ.
Memulai dengan Voyage AI
Untuk mengakses embeddings Voyage:
- Daftar di situs web Voyage AI
- Dapatkan kunci API
- Atur kunci API sebagai variabel lingkungan untuk kemudahan:
Anda dapat memperoleh embeddings dengan menggunakan paket Python resmi voyageai
atau permintaan HTTP, seperti yang dijelaskan di bawah ini.
Paket Python Voyage
Paket voyageai
dapat diinstal menggunakan perintah berikut:
Kemudian, Anda dapat membuat objek klien dan mulai menggunakannya untuk meng-embed teks Anda:
result.embeddings
akan menjadi daftar dua vektor embedding, masing-masing berisi 1024 angka floating-point. Setelah menjalankan kode di atas, kedua embedding akan dicetak di layar:
Saat membuat embeddings, Anda juga dapat menentukan beberapa argumen lain untuk fungsi embed()
. Anda dapat membaca lebih lanjut tentang spesifikasinya di sini
API HTTP Voyage
Anda juga dapat mendapatkan embeddings dengan meminta API HTTP Voyage. Misalnya, Anda dapat mengirim permintaan HTTP melalui perintah curl
di terminal:
Respons yang akan Anda dapatkan adalah objek JSON yang berisi embeddings dan penggunaan token:
Anda dapat membaca lebih lanjut tentang endpoint embedding di dokumentasi Voyage
AWS Marketplace
Embeddings Voyage juga tersedia di AWS Marketplace. Instruksi untuk mengakses Voyage di AWS tersedia di sini.
Contoh Quickstart
Sekarang kita tahu cara mendapatkan embeddings, mari kita lihat contoh singkat.
Misalkan kita memiliki korpus kecil berisi enam dokumen untuk diambil
Kita akan pertama-tama menggunakan Voyage untuk mengubah masing-masing menjadi vektor embedding
Embeddings akan memungkinkan kita melakukan pencarian semantik / pengambilan dalam ruang vektor. Diberikan contoh query,
kita mengubahnya menjadi embedding, dan melakukan pencarian tetangga terdekat untuk menemukan dokumen yang paling relevan berdasarkan jarak dalam ruang embedding.
Perhatikan bahwa kita menggunakan input_type="document"
dan input_type="query"
untuk masing-masing embedding dokumen dan query. Spesifikasi lebih lanjut dapat ditemukan di sini.
Outputnya akan menjadi dokumen ke-5, yang memang paling relevan dengan query:
Jika Anda mencari kumpulan buku panduan terperinci tentang cara melakukan RAG dengan embeddings, termasuk database vektor, lihat RAG cookbook kami.
FAQ
Harga
Kunjungi halaman harga Voyage untuk detail harga terbaru.
Was this page helpful?