嵌入向量

在實施嵌入向量之前

在選擇嵌入向量提供商時，根據您的需求和偏好，可以考慮以下幾個因素：

數據集大小和領域特異性：模型訓練數據集的大小及其與您要嵌入的領域的相關性。更大或更具領域特異性的數據通常會產生更好的領域內嵌入向量
推理性能：嵌入向量查找速度和端到端延遲。這對於大規模生產部署來說是一個特別重要的考慮因素
自定義：在私有數據上繼續訓練的選項，或針對特定領域的模型專門化。這可以提高在獨特詞彙表上的性能

如何通過 Anthropic 獲取嵌入向量

Anthropic 並不提供自己的嵌入模型。Voyage AI 是一個提供多種選項和功能的嵌入向量提供商，涵蓋了上述所有考慮因素。

Voyage AI 提供最先進的嵌入模型，並為金融和醫療保健等特定行業領域提供定制模型，或為個別客戶提供定制微調模型。

本指南的其餘部分是關於 Voyage AI 的，但我們建議您評估各種嵌入向量供應商，以找到最適合您特定用例的供應商。

可用模型

Voyage 推薦使用以下文本嵌入模型：

模型	上下文長度	嵌入維度	描述
`voyage-3-large`	32,000	1024（默認）, 256, 512, 2048	最佳通用和多語言檢索質量。
`voyage-3`	32,000	1024	針對通用和多語言檢索質量優化。詳情請參閱博客文章。
`voyage-3-lite`	32,000	512	針對延遲和成本優化。詳情請參閱博客文章。
`voyage-code-3`	32,000	1024（默認）, 256, 512, 2048	針對代碼檢索優化。詳情請參閱博客文章。
`voyage-finance-2`	32,000	1024	針對金融檢索和 RAG 優化。詳情請參閱博客文章。
`voyage-law-2`	16,000	1024	針對法律和長上下文檢索和 RAG 優化。同時提升所有領域的性能。詳情請參閱博客文章。

此外，推薦使用以下多模態嵌入模型：

模型	上下文長度	嵌入維度	描述
`voyage-multimodal-3`	32000	1024	豐富的多模態嵌入模型，可以向量化交錯的文本和內容豐富的圖像，如 PDF 截圖、幻燈片、表格、圖表等。詳情請參閱博客文章。

需要幫助決定使用哪個文本嵌入模型？查看常見問題。

Voyage AI 入門

要訪問 Voyage 嵌入向量：

在 Voyage AI 的網站上註冊
獲取 API 密鑰
為方便起見，將 API 密鑰設置為環境變量：

export VOYAGE_API_KEY="<your secret key>"

您可以通過使用官方 voyageai Python 包或 HTTP 請求來獲取嵌入向量，如下所述。

Voyage Python 包

可以使用以下命令安裝 voyageai 包：

pip install -U voyageai

然後，您可以創建一個客戶端對象並開始使用它來嵌入您的文本：

import voyageai

vo = voyageai.Client()
# 這將自動使用環境變量 VOYAGE_API_KEY。
# 或者，您可以使用 vo = voyageai.Client(api_key="<your secret key>")

texts = ["示例文本 1", "示例文本 2"]

result = vo.embed(texts, model="voyage-3", input_type="document")
print(result.embeddings[0])
print(result.embeddings[1])

result.embeddings 將是一個包含兩個嵌入向量的列表，每個向量包含 1024 個浮點數。運行上述代碼後，兩個嵌入向量將顯示在屏幕上：

[0.02012746, 0.01957859, ...]  # "示例文本 1" 的嵌入向量
[0.01429677, 0.03077182, ...]  # "示例文本 2" 的嵌入向量

在創建嵌入向量時，您還可以為 embed() 函數指定其他一些參數。您可以在此處閱讀更多規範

Voyage HTTP API

您也可以通過請求 Voyage HTTP API 獲取嵌入向量。例如，您可以在終端中通過 curl 命令發送 HTTP 請求：

curl https://api.voyageai.com/v1/embeddings \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $VOYAGE_API_KEY" \
  -d '{
    "input": ["示例文本 1", "示例文本 2"],
    "model": "voyage-3"
  }'

您將收到一個包含嵌入向量和令牌使用情況的 JSON 對象：

{
  "object": "list",
  "data": [
    {
      "embedding": [0.02012746, 0.01957859, ...],
      "index": 0
    },
    {
      "embedding": [0.01429677, 0.03077182, ...],
      "index": 1
    }
  ],
  "model": "voyage-3",
  "usage": {
    "total_tokens": 10
  }
}

您可以在 Voyage 文檔中閱讀更多關於嵌入端點的信息

AWS Marketplace

Voyage 嵌入向量也可在 AWS Marketplace 上獲得。在 AWS 上訪問 Voyage 的說明可在此處獲得。

快速入門示例

現在我們知道如何獲取嵌入向量，讓我們看一個簡短的示例。

假設我們有六個文檔的小型語料庫可供檢索

documents = [
    "地中海飲食強調魚類、橄欖油和蔬菜，被認為可以減少慢性疾病。",
    "植物的光合作用將光能轉化為葡萄糖並產生必需的氧氣。",
    "20世紀的創新，從收音機到智能手機，都圍繞著電子技術的進步。",
    "河流提供水源、灌溉和水生物種的棲息地，對生態系統至關重要。",
    "Apple 將於 2023 年 11 月 2 日星期四太平洋時間下午 2:00 / 東部時間下午 5:00 舉行第四財季業績和業務更新電話會議。",
    "莎士比亞的作品，如《哈姆雷特》和《仲夏夜之夢》，在文學中經久不衰。"
]

我們首先使用 Voyage 將每個文檔轉換為嵌入向量

import voyageai

vo = voyageai.Client()

# 嵌入文檔
doc_embds = vo.embed(
    documents, model="voyage-3", input_type="document"
).embeddings

嵌入向量將允許我們在向量空間中進行語義搜索/檢索。給定一個示例查詢，

query = "Apple 的電話會議安排在什麼時候？"

我們將其轉換為嵌入向量，並進行最近鄰搜索，根據嵌入空間中的距離找到最相關的文檔。

import numpy as np

# 嵌入查詢
query_embd = vo.embed(
    [query], model="voyage-3", input_type="query"
).embeddings[0]

# 計算相似度
# Voyage 嵌入向量被歸一化為長度 1，因此點積
# 和餘弦相似度是相同的。
similarities = np.dot(doc_embds, query_embd)

retrieved_id = np.argmax(similarities)
print(documents[retrieved_id])

請注意，我們分別使用 input_type="document" 和 input_type="query" 來嵌入文檔和查詢。更多規範可以在這裡找到。

輸出將是第 5 個文檔，這確實是與查詢最相關的：

Apple 將於 2023 年 11 月 2 日星期四太平洋時間下午 2:00 / 東部時間下午 5:00 舉行第四財季業績和業務更新電話會議。

如果您正在尋找關於如何使用嵌入向量進行 RAG 的詳細食譜集，包括向量數據庫，請查看我們的 RAG 食譜。

常見問題

為什麼 Voyage 嵌入向量具有卓越的質量？

有哪些嵌入模型可用，我應該使用哪個？

我應該使用哪種相似度函數？

我應該如何使用 input_type 參數？

對於包括 RAG 在內的檢索任務，始終將 input_type 指定為 “query” 或 “document”。這種優化通過專門的提示前綴改善檢索質量：

對於查詢：

表示用於檢索支持文檔的查詢：[您的查詢]

對於文檔：

表示用於檢索的文檔：[您的文檔]

對於檢索任務，切勿省略 input_type 或將其設置為 None。

對於使用 voyage-large-2-instruct 的分類、聚類或其他 MTEB 任務，請按照我們 GitHub 倉庫中的說明操作。

有哪些量化選項可用？

量化通過將高精度值轉換為低精度格式來減少存儲、內存和成本。可用的輸出數據類型（output_dtype）：

類型	描述	大小減少
`float`	32位單精度浮點（默認）	無
`int8`/`uint8`	8位整數（-128 到 127 / 0 到 255）	4倍
`binary`/`ubinary`	位打包單位值	32倍

二進制類型使用 8 位整數來表示打包的位，binary 使用偏移二進制方法。

示例： 二進制量化將八個嵌入值轉換為單個 8 位整數：

原始值：[-0.03955078, 0.006214142, -0.07446289, -0.039001465, 
        0.0046463013, 0.00030612946, -0.08496094, 0.03994751]
二進制：[0, 1, 0, 0, 1, 1, 0, 1] → 01001101
uint8：77
int8：-51（使用偏移二進制）

如何截斷套娃嵌入向量？

套娃嵌入向量包含從粗到細的表示，可以通過保留前導維度來截斷。以下是如何將 1024D 向量截斷為 256D：

import voyageai
import numpy as np

def embd_normalize(v: np.ndarray) -> np.ndarray:
    """
    將嵌入向量歸一化為單位長度。
    如果任何行的範數為零，則引發 ValueError。
    """
    row_norms = np.linalg.norm(v, axis=1, keepdims=True)
    if np.any(row_norms == 0):
        raise ValueError("無法歸一化範數為零的行。")
    return v / row_norms

# 初始化客戶端
vo = voyageai.Client()

# 生成 1024D 向量
embd = vo.embed(['示例文本 1', '示例文本 2'], 
               model='voyage-code-3').embeddings

# 截斷為 256D
short_dim = 256
resized_embd = embd_normalize(
    np.array(embd)[:, :short_dim]
).tolist()

定價

訪問 Voyage 的定價頁面以獲取最新的定價詳情。

Token 計數視覺

On this page

在實施嵌入向量之前
如何通過 Anthropic 獲取嵌入向量
可用模型
Voyage AI 入門
Voyage Python 包
Voyage HTTP API
AWS Marketplace
快速入門示例
常見問題
定價

入門步驟

模型與定價

了解 Claude

功能

工具

模型上下文協定 (MCP)

使用案例

提示工程

測試與評估

加強防護機制

法律中心

在實施嵌入向量之前

如何通過 Anthropic 獲取嵌入向量

可用模型

Voyage AI 入門

Voyage Python 包

Voyage HTTP API

AWS Marketplace

快速入門示例

常見問題

定價

入門步驟

模型與定價

了解 Claude

功能

工具

模型上下文協定 (MCP)

使用案例

提示工程

測試與評估

加強防護機制

法律中心

​在實施嵌入向量之前

​如何通過 Anthropic 獲取嵌入向量

​可用模型

​Voyage AI 入門

​Voyage Python 包

​Voyage HTTP API

​AWS Marketplace

​快速入門示例

​常見問題

​定價

在實施嵌入向量之前

如何通過 Anthropic 獲取嵌入向量

可用模型

Voyage AI 入門

Voyage Python 包

Voyage HTTP API

AWS Marketplace

快速入門示例

常見問題

定價