PDF対応
Claudeを使用してPDFを処理します。ドキュメントからテキストを抽出し、グラフを分析し、視覚的なコンテンツを理解します。
提供したPDFに含まれるテキスト、画像、グラフ、表についてClaudeに質問できるようになりました。主な使用例:
- 財務報告書の分析とグラフ/表の理解
- 法的文書からの重要情報の抽出
- 文書の翻訳支援
- 文書情報の構造化フォーマットへの変換
始める前に
PDF要件の確認
Claudeは標準的なPDFで動作します。ただし、PDF対応機能を使用する際は、リクエストサイズが以下の要件を満たしていることを確認してください:
要件 | 制限 |
---|---|
最大リクエストサイズ | 32MB |
リクエストあたりの最大ページ数 | 100 |
フォーマット | 標準PDF(パスワード/暗号化なし) |
これらの制限は、PDFと一緒に送信される他のコンテンツを含むリクエスト全体に適用されることにご注意ください。
PDF対応はClaudeのビジョン機能に依存しているため、他のビジョンタスクと同じ制限事項と考慮事項が適用されます。
対応プラットフォームとモデル
PDF対応は現在、直接APIアクセスとGoogle Vertex AIを通じて、Claude 3.7 Sonnet(claude-3-7-sonnet-20250219
)、両方のClaude 3.5 Sonnetモデル(claude-3-5-sonnet-20241022
、claude-3-5-sonnet-20240620
)、およびClaude 3.5 Haiku(claude-3-5-haiku-20241022
)で利用可能です。この機能はまもなくAmazon Bedrockでもサポートされる予定です。
ClaudeでPDFを処理する
最初のPDFリクエストを送信する
Messages APIを使用した簡単な例から始めましょう。PDFをClaudeに提供する方法は2つあります:
document
コンテンツブロックでbase64エンコードされたPDFとして- オンラインでホストされているPDFへのURL参照として
オプション1:URLベースのPDFドキュメント
最も簡単なアプローチは、URLから直接PDFを参照することです:
オプション2:Base64エンコードされたPDFドキュメント
ローカルシステムからPDFを送信する必要がある場合や、URLが利用できない場合:
PDF対応の仕組み
PDFをClaudeに送信すると、以下のステップが実行されます:
システムがドキュメントの内容を抽出します。
- システムはドキュメントの各ページを画像に変換します。
- 各ページのテキストが抽出され、各ページの画像と共に提供されます。
Claudeはドキュメントをより良く理解するために、テキストと画像の両方を分析します。
- ドキュメントはテキストと画像の組み合わせとして分析のために提供されます。
- これにより、ユーザーはグラフ、図表、その他の非テキストコンテンツなど、PDFの視覚的要素に関する洞察を求めることができます。
Claudeは、関連する場合はPDFの内容を参照しながら応答します。
Claudeは応答する際にテキストと視覚的なコンテンツの両方を参照できます。以下を統合することで、さらにパフォーマンスを向上させることができます:
- プロンプトキャッシング:繰り返し分析のパフォーマンスを向上
- バッチ処理:大量のドキュメント処理向け
- ツール使用:ツール入力として使用するための特定の情報をドキュメントから抽出
コストを見積もる
PDFファイルのトークン数は、ドキュメントから抽出された総テキスト量とページ数に依存します:
- テキストトークンのコスト:各ページは通常、コンテンツの密度に応じて1ページあたり1,500〜3,000トークンを使用します。追加のPDF料金なしで標準APIの価格が適用されます。
- 画像トークンのコスト:各ページは画像に変換されるため、同じ画像ベースのコスト計算が適用されます。
特定のPDFのコストを見積もるにはトークンカウントを使用できます。
PDF処理の最適化
パフォーマンスの向上
最適な結果を得るために、以下のベストプラクティスに従ってください:
- リクエストでPDFをテキストの前に配置する
- 標準フォントを使用する
- テキストが明確で読みやすいことを確認する
- ページを適切な上向きの向きに回転させる
- プロンプトでは論理的なページ番号(PDFビューアからの)を使用する
- 必要に応じて大きなPDFを分割する
- 繰り返し分析にはプロンプトキャッシングを有効にする
実装のスケーリング
大量処理の場合、以下のアプローチを検討してください:
プロンプトキャッシングを使用する
繰り返しのクエリのパフォーマンスを向上させるためにPDFをキャッシュします:
ドキュメントのバッチを処理する
大量のワークフロー向けにMessage Batches APIを使用します:
次のステップ
Was this page helpful?