PDF 支援功能(測試版)
Claude 3.5 Sonnet 模型現在支援 PDF 輸入,並能理解文件中的文字和視覺內容。
PDF 支援功能正處於公開測試階段
要使用此功能,請在您的 API 請求中包含 anthropic-beta: pdfs-2024-09-25
標頭。
我們將在接下來的幾週內持續改進這個開放測試版,因此我們非常感謝您的反饋。請使用此表單分享您的想法和建議。
PDF 功能
Claude 可以處理任何標準 PDF。您可以詢問 Claude 關於您提供的 PDF 中的任何文字、圖片、圖表和表格。一些使用案例範例:
- 分析財務報告並理解圖表/表格
- 從法律文件中提取關鍵信息
- 文件翻譯協助
- 將文件信息轉換為結構化格式
PDF 支援功能的運作方式
當您發送包含 PDF 文件的請求時:
系統提取文件內容。
- 系統將文件的每一頁轉換為圖像。
- 從每一頁提取文字並與該頁的圖像一起提供。
Claude 同時分析文字和圖像以更好地理解文件。
- 文件以文字和圖像的組合形式提供進行分析。
- 這使用戶能夠詢問 PDF 中的視覺元素,如圖表、圖解和其他非文字內容。
與其他 Claude 功能一起使用文件。
PDF 支援功能可以很好地配合:
- 提示快取:提高重複分析的性能。
- 批次處理:用於大量文件處理。
- 工具使用:從文件中提取特定信息用作工具輸入。
PDF 支援限制
在將 PDF 支援整合到您的應用程序之前,請確保您的文件符合以下要求:
要求 | 限制 |
---|---|
最大請求大小 | 32MB |
每個請求的最大頁數 | 100 |
支援的模型 | claude-3-5-sonnet-20241022 , claude-3-5-sonnet-20240620 |
請注意,這兩個限制都是針對整個請求負載,包括與 PDF 一起發送的任何其他內容。 提供的 PDF 不應有任何密碼或加密。
由於 PDF 支援依賴於 Claude 的視覺功能,因此受到相同的限制。
支援的平台和模型
PDF 支援目前可通過直接 API 訪問在兩個 Claude 3.5 Sonnet 模型(claude-3-5-sonnet-20241022
、claude-3-5-sonnet-20240620
)上使用。此功能將很快在 Amazon Bedrock 和 Google Vertex AI 上支援。
計算預期的令牌使用量
PDF 文件的令牌數量取決於從文件中提取的總文字量以及頁數。由於每頁都會轉換為圖像,因此會應用相同的基於圖像的成本計算。 每頁通常使用 1,500 到 3,000 個令牌,具體取決於內容密度。適用標準輸入令牌定價,PDF 處理不收取額外費用。
您也可以使用令牌計數來確定包含 PDF 的消息中的令牌數量。
如何在 Messages API 中使用 PDF
以下是在 Messages API 中使用 PDF 的簡單示例:
以下是一些其他幫助您入門的示例:
PDF 分析最佳實踐
- 確保文字清晰易讀。
- 將頁面旋轉至正確方向。
- 在引用頁碼時,使用邏輯頁碼(PDF 查看器報告的數字)而不是實際頁碼(頁面上可見的數字)
- 使用標準字體。
- 在請求中將 PDF 放在文字之前。
- 當超出限制時,將大型 PDF 分割成較小的塊。
- 對同一文件的重複分析使用提示快取。
下一步
準備好開始使用 Claude 處理 PDF 了嗎?以下是一些有用的資源: