PDF 支援功能正處於公開測試階段

要使用此功能,請在您的 API 請求中包含 anthropic-beta: pdfs-2024-09-25 標頭。

我們將在接下來的幾週內持續改進這個開放測試版,因此我們非常感謝您的反饋。請使用此表單分享您的想法和建議。


PDF 功能

Claude 可以處理任何標準 PDF。您可以詢問 Claude 關於您提供的 PDF 中的任何文字、圖片、圖表和表格。一些使用案例範例:

  • 分析財務報告並理解圖表/表格
  • 從法律文件中提取關鍵信息
  • 文件翻譯協助
  • 將文件信息轉換為結構化格式

PDF 支援功能的運作方式

當您發送包含 PDF 文件的請求時:

1

系統提取文件內容。

  • 系統將文件的每一頁轉換為圖像。
  • 從每一頁提取文字並與該頁的圖像一起提供。
2

Claude 同時分析文字和圖像以更好地理解文件。

  • 文件以文字和圖像的組合形式提供進行分析。
  • 這使用戶能夠詢問 PDF 中的視覺元素,如圖表、圖解和其他非文字內容。
3

與其他 Claude 功能一起使用文件。

PDF 支援功能可以很好地配合:

  • 提示快取:提高重複分析的性能。
  • 批次處理:用於大量文件處理。
  • 工具使用:從文件中提取特定信息用作工具輸入。

PDF 支援限制

在將 PDF 支援整合到您的應用程序之前,請確保您的文件符合以下要求:

要求限制
最大請求大小32MB
每個請求的最大頁數100
支援的模型claude-3-5-sonnet-20241022, claude-3-5-sonnet-20240620

請注意,這兩個限制都是針對整個請求負載,包括與 PDF 一起發送的任何其他內容。 提供的 PDF 不應有任何密碼或加密。

由於 PDF 支援依賴於 Claude 的視覺功能,因此受到相同的限制

支援的平台和模型

PDF 支援目前可通過直接 API 訪問在兩個 Claude 3.5 Sonnet 模型(claude-3-5-sonnet-20241022claude-3-5-sonnet-20240620)上使用。此功能將很快在 Amazon Bedrock 和 Google Vertex AI 上支援。

計算預期的令牌使用量

PDF 文件的令牌數量取決於從文件中提取的總文字量以及頁數。由於每頁都會轉換為圖像,因此會應用相同的基於圖像的成本計算。 每頁通常使用 1,500 到 3,000 個令牌,具體取決於內容密度。適用標準輸入令牌定價,PDF 處理不收取額外費用。

您也可以使用令牌計數來確定包含 PDF 的消息中的令牌數量。


如何在 Messages API 中使用 PDF

以下是在 Messages API 中使用 PDF 的簡單示例:

以下是一些其他幫助您入門的示例:


PDF 分析最佳實踐

  • 確保文字清晰易讀。
  • 將頁面旋轉至正確方向。
  • 在引用頁碼時,使用邏輯頁碼(PDF 查看器報告的數字)而不是實際頁碼(頁面上可見的數字)
  • 使用標準字體。
  • 在請求中將 PDF 放在文字之前。
  • 當超出限制時,將大型 PDF 分割成較小的塊。
  • 對同一文件的重複分析使用提示快取。

下一步

準備好開始使用 Claude 處理 PDF 了嗎?以下是一些有用的資源: