Эмбеддинги
Текстовые эмбеддинги - это числовые представления текста, позволяющие измерять семантическое сходство. Это руководство знакомит с эмбеддингами, их применением и использованием моделей эмбеддингов для таких задач, как поиск, рекомендации и обнаружение аномалий.
Перед внедрением эмбеддингов
При выборе провайдера эмбеддингов следует учитывать несколько факторов в зависимости от ваших потребностей и предпочтений:
- Размер набора данных и специфика предметной области: размер набора данных для обучения модели и его релевантность для области, в которой вы хотите создавать эмбеддинги. Более крупные или специализированные данные обычно дают лучшие эмбеддинги в конкретной области
- Производительность при выводе: скорость поиска эмбеддингов и общая задержка. Это особенно важно для масштабных производственных развертываний
- Настройка: возможности дальнейшего обучения на частных данных или специализации моделей для конкретных областей. Это может улучшить работу с уникальными словарями
Как получить эмбеддинги с Anthropic
Anthropic не предлагает собственную модель эмбеддингов. Одним из провайдеров эмбеддингов, который предлагает широкий спектр возможностей, охватывающих все вышеперечисленные аспекты, является Voyage AI.
Voyage AI создает современные модели эмбеддингов и предлагает настроенные модели для конкретных отраслей, таких как финансы и здравоохранение, или специальные модели, настроенные для отдельных клиентов.
Остальная часть этого руководства посвящена Voyage AI, но мы рекомендуем вам оценить различных поставщиков эмбеддингов, чтобы найти наиболее подходящий вариант для вашего конкретного случая.
Доступные модели
Voyage рекомендует использовать следующие модели текстовых эмбеддингов:
Модель | Длина контекста | Размерность эмбеддинга | Описание |
---|---|---|---|
voyage-3-large | 32,000 | 1024 (по умолчанию), 256, 512, 2048 | Лучшее качество для общего назначения и многоязычного поиска. |
voyage-3 | 32,000 | 1024 | Оптимизирована для общего назначения и многоязычного поиска. Подробности в блоге. |
voyage-3-lite | 32,000 | 512 | Оптимизирована для низкой задержки и стоимости. Подробности в блоге. |
voyage-code-3 | 32,000 | 1024 (по умолчанию), 256, 512, 2048 | Оптимизирована для поиска кода. Подробности в блоге. |
voyage-finance-2 | 32,000 | 1024 | Оптимизирована для финансового поиска и RAG. Подробности в блоге. |
voyage-law-2 | 16,000 | 1024 | Оптимизирована для юридического и длинного контекста поиска и RAG. Также улучшена производительность во всех областях. Подробности в блоге. |
Дополнительно рекомендуются следующие мультимодальные модели эмбеддингов:
Модель | Длина контекста | Размерность эмбеддинга | Описание |
---|---|---|---|
voyage-multimodal-3 | 32000 | 1024 | Богатая мультимодальная модель эмбеддингов, способная векторизовать чередующийся текст и содержательные изображения, такие как скриншоты PDF, слайды, таблицы, рисунки и многое другое. Подробности в блоге. |
Нужна помощь в выборе модели текстовых эмбеддингов? Ознакомьтесь с FAQ.
Начало работы с Voyage AI
Для доступа к эмбеддингам Voyage:
- Зарегистрируйтесь на сайте Voyage AI
- Получите API ключ
- Установите API ключ как переменную окружения для удобства:
Вы можете получить эмбеддинги, используя либо официальный voyageai
Python пакет, либо HTTP запросы, как описано ниже.
Python пакет Voyage
Пакет voyageai
можно установить с помощью следующей команды:
Затем вы можете создать объект клиента и начать использовать его для создания эмбеддингов ваших текстов:
result.embeddings
будет списком из двух векторов эмбеддингов, каждый из которых содержит 1024 числа с плавающей точкой. После выполнения вышеуказанного кода, два эмбеддинга будут выведены на экран:
При создании эмбеддингов вы также можете указать несколько других аргументов для функции embed()
. Подробнее о спецификации можно прочитать здесь
HTTP API Voyage
Вы также можете получить эмбеддинги, отправив HTTP запрос через команду curl
в терминале:
Ответ, который вы получите, будет JSON объектом, содержащим эмбеддинги и использование токенов:
Подробнее о конечной точке эмбеддингов можно прочитать в документации Voyage
AWS Marketplace
Эмбеддинги Voyage также доступны на AWS Marketplace. Инструкции по доступу к Voyage на AWS доступны здесь.
Пример быстрого старта
Теперь, когда мы знаем, как получить эмбеддинги, давайте рассмотрим краткий пример.
Предположим, у нас есть небольшой корпус из шести документов для поиска
Сначала мы используем Voyage для преобразования каждого из них в вектор эмбеддинга
Эмбеддинги позволят нам выполнять семантический поиск / извлечение в векторном пространстве. Для примера запроса,
мы преобразуем его в эмбеддинг и проводим поиск ближайшего соседа, чтобы найти наиболее релевантный документ на основе расстояния в пространстве эмбеддингов.
Обратите внимание, что мы используем input_type="document"
и input_type="query"
для создания эмбеддингов документа и запроса соответственно. Более подробную спецификацию можно найти здесь.
Результатом будет 5-й документ, который действительно наиболее релевантен запросу:
Если вы ищете подробный набор руководств по работе с RAG с использованием эмбеддингов, включая векторные базы данных, ознакомьтесь с нашим руководством по RAG.
FAQ
Цены
Посетите страницу с ценами Voyage для получения актуальной информации о ценах.
Was this page helpful?