Текстовые эмбеддинги - это числовые представления текста, позволяющие измерять семантическое сходство. Это руководство знакомит с эмбеддингами, их применением и использованием моделей эмбеддингов для таких задач, как поиск, рекомендации и обнаружение аномалий.
Модель | Длина контекста | Размерность эмбеддинга | Описание |
---|---|---|---|
voyage-3-large | 32,000 | 1024 (по умолчанию), 256, 512, 2048 | Лучшее качество для общего назначения и многоязычного поиска. |
voyage-3 | 32,000 | 1024 | Оптимизирована для общего назначения и многоязычного поиска. Подробности в блоге. |
voyage-3-lite | 32,000 | 512 | Оптимизирована для низкой задержки и стоимости. Подробности в блоге. |
voyage-code-3 | 32,000 | 1024 (по умолчанию), 256, 512, 2048 | Оптимизирована для поиска кода. Подробности в блоге. |
voyage-finance-2 | 32,000 | 1024 | Оптимизирована для финансового поиска и RAG. Подробности в блоге. |
voyage-law-2 | 16,000 | 1024 | Оптимизирована для юридического и длинного контекста поиска и RAG. Также улучшена производительность во всех областях. Подробности в блоге. |
Модель | Длина контекста | Размерность эмбеддинга | Описание |
---|---|---|---|
voyage-multimodal-3 | 32000 | 1024 | Богатая мультимодальная модель эмбеддингов, способная векторизовать чередующийся текст и содержательные изображения, такие как скриншоты PDF, слайды, таблицы, рисунки и многое другое. Подробности в блоге. |
voyageai
Python пакет, либо HTTP запросы, как описано ниже.
voyageai
можно установить с помощью следующей команды:
result.embeddings
будет списком из двух векторов эмбеддингов, каждый из которых содержит 1024 числа с плавающей точкой. После выполнения вышеуказанного кода, два эмбеддинга будут выведены на экран:
embed()
. Подробнее о спецификации можно прочитать здесь
curl
в терминале:
input_type="document"
и input_type="query"
для создания эмбеддингов документа и запроса соответственно. Более подробную спецификацию можно найти здесь.
Результатом будет 5-й документ, который действительно наиболее релевантен запросу:
Почему эмбеддинги Voyage имеют превосходное качество?
Какие модели эмбеддингов доступны и какую следует использовать?
voyage-3-large
: Лучшее качествоvoyage-3-lite
: Наименьшая задержка и стоимостьvoyage-3
: Сбалансированная производительность с превосходным качеством поиска по конкурентоспособной ценеinput_type
для указания типа запроса или документа.Модели для конкретных областей:voyage-law-2
voyage-code-3
voyage-finance-2
Какую функцию сходства следует использовать?
Как следует использовать параметр input_type?
input_type
как “query” или “document”. Эта оптимизация улучшает качество поиска через специализированные префиксы промптов:Для запросов:input_type
и не устанавливайте его в None
для задач поиска.voyage-large-2-instruct
, следуйте инструкциям в нашем GitHub репозитории.Какие варианты квантования доступны?
output_dtype
):Тип | Описание | Уменьшение размера |
---|---|---|
float | 32-битное число с плавающей точкой одинарной точности (по умолчанию) | Нет |
int8 /uint8 | 8-битные целые числа (-128 до 127 / 0 до 255) | 4x |
binary /ubinary | Упакованные однобитные значения | 32x |
binary
использует метод смещенного двоичного кода.Как можно усечь матрёшка-эмбеддинги?