提供したPDFに含まれるテキスト、画像、グラフ、表についてClaudeに質問できるようになりました。主な使用例:

  • 財務報告書の分析とグラフ/表の理解
  • 法的文書からの重要情報の抽出
  • 文書の翻訳支援
  • 文書情報の構造化フォーマットへの変換

始める前に

PDF要件の確認

Claudeは標準的なPDFで動作します。ただし、PDF対応機能を使用する際は、リクエストサイズが以下の要件を満たしていることを確認してください:

要件制限
最大リクエストサイズ32MB
リクエストあたりの最大ページ数100
フォーマット標準PDF(パスワード/暗号化なし)

これらの制限は、PDFと一緒に送信される他のコンテンツを含むリクエスト全体に適用されることにご注意ください。

PDF対応はClaudeのビジョン機能に依存しているため、他のビジョンタスクと同じ制限事項と考慮事項が適用されます。

対応プラットフォームとモデル

PDF対応は現在、直接APIアクセスとGoogle Vertex AIを通じて、Claude 3.7 Sonnet(claude-3-7-sonnet-20250219)、両方のClaude 3.5 Sonnetモデル(claude-3-5-sonnet-20241022claude-3-5-sonnet-20240620)、およびClaude 3.5 Haiku(claude-3-5-haiku-20241022)で利用可能です。この機能はまもなくAmazon Bedrockでもサポートされる予定です。


ClaudeでPDFを処理する

最初のPDFリクエストを送信する

Messages APIを使用した簡単な例から始めましょう。PDFをClaudeに提供する方法は2つあります:

  1. documentコンテンツブロックでbase64エンコードされたPDFとして
  2. オンラインでホストされているPDFへのURL参照として

オプション1:URLベースのPDFドキュメント

最も簡単なアプローチは、URLから直接PDFを参照することです:

オプション2:Base64エンコードされたPDFドキュメント

ローカルシステムからPDFを送信する必要がある場合や、URLが利用できない場合:

PDF対応の仕組み

PDFをClaudeに送信すると、以下のステップが実行されます:

1

システムがドキュメントの内容を抽出します。

  • システムはドキュメントの各ページを画像に変換します。
  • 各ページのテキストが抽出され、各ページの画像と共に提供されます。
2

Claudeはドキュメントをより良く理解するために、テキストと画像の両方を分析します。

  • ドキュメントはテキストと画像の組み合わせとして分析のために提供されます。
  • これにより、ユーザーはグラフ、図表、その他の非テキストコンテンツなど、PDFの視覚的要素に関する洞察を求めることができます。
3

Claudeは、関連する場合はPDFの内容を参照しながら応答します。

Claudeは応答する際にテキストと視覚的なコンテンツの両方を参照できます。以下を統合することで、さらにパフォーマンスを向上させることができます:

  • プロンプトキャッシング:繰り返し分析のパフォーマンスを向上
  • バッチ処理:大量のドキュメント処理向け
  • ツール使用:ツール入力として使用するための特定の情報をドキュメントから抽出

コストを見積もる

PDFファイルのトークン数は、ドキュメントから抽出された総テキスト量とページ数に依存します:

  • テキストトークンのコスト:各ページは通常、コンテンツの密度に応じて1ページあたり1,500〜3,000トークンを使用します。追加のPDF料金なしで標準APIの価格が適用されます。
  • 画像トークンのコスト:各ページは画像に変換されるため、同じ画像ベースのコスト計算が適用されます。

特定のPDFのコストを見積もるにはトークンカウントを使用できます。


PDF処理の最適化

パフォーマンスの向上

最適な結果を得るために、以下のベストプラクティスに従ってください:

  • リクエストでPDFをテキストの前に配置する
  • 標準フォントを使用する
  • テキストが明確で読みやすいことを確認する
  • ページを適切な上向きの向きに回転させる
  • プロンプトでは論理的なページ番号(PDFビューアからの)を使用する
  • 必要に応じて大きなPDFを分割する
  • 繰り返し分析にはプロンプトキャッシングを有効にする

実装のスケーリング

大量処理の場合、以下のアプローチを検討してください:

プロンプトキャッシングを使用する

繰り返しのクエリのパフォーマンスを向上させるためにPDFをキャッシュします:

ドキュメントのバッチを処理する

大量のワークフロー向けにMessage Batches APIを使用します:

次のステップ