您现在可以向Claude询问您提供的PDF中的任何文本、图片、图表和表格。一些示例用例:

  • 分析财务报告并理解图表/表格
  • 从法律文档中提取关键信息
  • 文档翻译辅助
  • 将文档信息转换为结构化格式

开始之前

检查PDF要求

Claude可以处理任何标准PDF。但是,在使用PDF支持时,您应确保您的请求大小符合以下要求:

要求限制
最大请求大小32MB
每个请求的最大页数100
格式标准PDF(无密码/加密)

请注意,这两个限制都是针对整个请求负载,包括与PDF一起发送的任何其他内容。

由于PDF支持依赖于Claude的视觉功能,它受制于与其他视觉任务相同的限制和考虑因素

支持的平台和模型

PDF支持目前通过直接API访问在两个Claude 3.5 Sonnet模型(claude-3-5-sonnet-20241022claude-3-5-sonnet-20240620)上可用。此功能很快将在Amazon Bedrock和Google Vertex AI上得到支持。


使用Claude处理PDF

发送您的第一个PDF请求

让我们从使用Messages API的一个简单示例开始:

PDF支持的工作原理

当您向Claude发送PDF时,会发生以下步骤:

1

系统提取文档内容。

  • 系统将文档的每一页转换为图像。
  • 从每一页提取文本并与每页的图像一起提供。
2

Claude分析文本和图像以更好地理解文档。

  • 文档以文本和图像的组合形式提供进行分析。
  • 这使用户可以询问PDF的视觉元素的见解,如图表、图解和其他非文本内容。
3

Claude响应,在相关时引用PDF的内容。

Claude可以在响应时引用文本和视觉内容。您可以通过以下方式进一步提高性能:

  • 提示缓存:提高重复分析的性能。
  • 批处理:用于高容量文档处理。
  • 工具使用:从文档中提取特定信息用作工具输入。

估算您的成本

PDF文件的令牌数量取决于从文档中提取的总文本以及页数:

  • 文本令牌成本:每页通常使用1,500-3,000个令牌,具体取决于内容密度。适用标准API定价,无额外PDF费用。
  • 图像令牌成本:由于每页都转换为图像,因此应用相同的基于图像的成本计算

您可以使用令牌计数来估算特定PDF的成本。


优化PDF处理

提高性能

遵循这些最佳实践以获得最佳结果:

  • 在请求中将PDF放在文本之前
  • 使用标准字体
  • 确保文本清晰可读
  • 将页面旋转至正确的竖直方向
  • 在提示中使用逻辑页码(来自PDF查看器)
  • 必要时将大型PDF分割成块
  • 对重复分析启用提示缓存

扩展您的实施

对于高容量处理,考虑以下方法:

使用提示缓存

缓存PDF以提高重复查询的性能:

处理文档批次

使用Message Batches API进行高容量工作流:

下一步

Was this page helpful?