使用 Claude 進行開發
PDF 支援
使用 Claude 3.5 Sonnet 處理 PDF。從您的文件中提取文字、分析圖表和理解視覺內容。
您現在可以詢問 Claude 關於您提供的 PDF 中的任何文字、圖片、圖表和表格。一些範例用途:
- 分析財務報告並理解圖表/表格
- 從法律文件中提取關鍵資訊
- 文件翻譯協助
- 將文件資訊轉換為結構化格式
開始之前
檢查 PDF 要求
Claude 可以處理任何標準 PDF。但是,在使用 PDF 支援時,您應確保您的請求大小符合以下要求:
要求 | 限制 |
---|---|
最大請求大小 | 32MB |
每次請求最大頁數 | 100 |
格式 | 標準 PDF(無密碼/加密) |
請注意,這兩個限制都是針對整個請求負載,包括與 PDF 一起發送的任何其他內容。
由於 PDF 支援依賴於 Claude 的視覺能力,因此它受制於與其他視覺任務相同的限制和考慮因素。
支援的平台和模型
PDF 支援目前可透過直接 API 存取在兩個 Claude 3.5 Sonnet 模型(claude-3-5-sonnet-20241022
、claude-3-5-sonnet-20240620
)上使用。此功能將很快在 Amazon Bedrock 和 Google Vertex AI 上支援。
使用 Claude 處理 PDF
發送您的第一個 PDF 請求
讓我們從使用 Messages API 的簡單範例開始:
PDF 支援如何運作
當您向 Claude 發送 PDF 時,會發生以下步驟:
1
系統提取文件的內容。
- 系統將文件的每一頁轉換為圖像。
- 從每一頁提取文字並與每頁的圖像一起提供。
2
Claude 分析文字和圖像以更好地理解文件。
- 文件以文字和圖像的組合形式提供進行分析。
- 這使用戶能夠詢問有關 PDF 視覺元素的見解,如圖表、圖解和其他非文字內容。
3
Claude 回應,在相關時引用 PDF 的內容。
Claude 可以在回應時引用文字和視覺內容。您可以通過以下方式進一步提升性能:
- 提示快取:提高重複分析的性能。
- 批次處理:用於高容量文件處理。
- 工具使用:從文件中提取特定資訊用作工具輸入。
估算您的成本
PDF 檔案的標記數量取決於從文件中提取的總文字以及頁數:
- 文字標記成本:每頁通常使用 1,500-3,000 個標記,具體取決於內容密度。適用標準 API 定價,無額外 PDF 費用。
- 圖像標記成本:由於每頁都會轉換為圖像,因此適用相同的基於圖像的成本計算。
您可以使用標記計數來估算特定 PDF 的成本。
優化 PDF 處理
提升性能
遵循這些最佳實踐以獲得最佳結果:
- 在請求中將 PDF 放在文字之前
- 使用標準字體
- 確保文字清晰易讀
- 將頁面旋轉至正確的直立方向
- 在提示中使用邏輯頁碼(來自 PDF 檢視器)
- 必要時將大型 PDF 分割成塊
- 對重複分析啟用提示快取
擴展您的實施
對於高容量處理,請考慮以下方法:
使用提示快取
快取 PDF 以提高重複查詢的性能:
處理文件批次
使用 Message Batches API 進行高容量工作流程: