PDF支持(测试版)
Claude 3.5 Sonnet模型现在支持PDF输入,并能理解文档中的文本和视觉内容。
PDF支持目前处于公开测试阶段
要访问此功能,请在您的API请求中包含anthropic-beta: pdfs-2024-09-25
标头。
我们将在接下来的几周内对这个公开测试版进行迭代,因此我们非常感谢您的反馈。请使用此表单分享您的想法和建议。
PDF功能
Claude可以处理任何标准PDF。您可以询问Claude关于您提供的PDF中的任何文本、图片、图表和表格。一些示例用例:
- 分析财务报告并理解图表/表格
- 从法律文件中提取关键信息
- 文档翻译辅助
- 将文档信息转换为结构化格式
PDF支持的工作原理
当您发送包含PDF文件的请求时:
系统提取文档内容。
- 系统将文档的每一页转换为图像。
- 从每一页提取文本并与该页的图像一起提供。
Claude同时分析文本和图像以更好地理解文档。
- 文档以文本和图像的组合形式提供以供分析。
- 这使用户可以询问PDF中的视觉元素,如图表、图解和其他非文本内容。
与其他Claude功能一起使用文档。
PDF支持可以很好地配合以下功能:
- 提示缓存:提高重复分析的性能。
- 批量处理:用于高容量文档处理。
- 工具使用:从文档中提取特定信息用作工具输入。
PDF支持限制
在将PDF支持集成到您的应用程序之前,请确保您的文件满足以下要求:
要求 | 限制 |
---|---|
最大请求大小 | 32MB |
每个请求的最大页数 | 100 |
支持的模型 | claude-3-5-sonnet-20241022 , claude-3-5-sonnet-20240620 |
请注意,这两个限制都是针对整个请求负载,包括与PDF一起发送的任何其他内容。 提供的PDF不应有任何密码或加密。
由于PDF支持依赖于Claude的视觉功能,因此它受制于相同的限制。
支持的平台和模型
PDF支持目前通过直接API访问在两个Claude 3.5 Sonnet模型(claude-3-5-sonnet-20241022
、claude-3-5-sonnet-20240620
)上可用。此功能很快将在Amazon Bedrock和Google Vertex AI上得到支持。
计算预期的令牌使用量
PDF文件的令牌数量取决于从文档中提取的总文本以及页数。由于每页都被转换为图像,因此应用相同的基于图像的成本计算。 每页通常使用1,500到3,000个令牌,具体取决于内容密度。适用标准输入令牌定价,PDF处理不收取额外费用。
您还可以使用令牌计数来确定包含PDF的消息中的令牌数量。
如何在Messages API中使用PDF
以下是在Messages API中使用PDF的简单示例:
以下是一些其他帮助您入门的示例:
PDF分析最佳实践
- 确保文本清晰可读。
- 将页面旋转到正确的方向。
- 在引用页码时,使用逻辑编号(PDF查看器报告的编号)而不是物理页码(页面上可见的编号)
- 使用标准字体。
- 在请求中将PDF放在文本之前。
- 当超出限制时,将很大的PDF拆分成更小的块。
- 对同一文档的重复分析使用提示缓存。
下一步
准备好开始使用Claude处理PDF了吗?以下是一些有用的资源: