Поддержка PDF находится в открытой бете

Для доступа к этой функции включите заголовок anthropic-beta: pdfs-2024-09-25 в ваши API-запросы.

Мы будем улучшать эту открытую бету в течение следующих недель, поэтому ценим ваши отзывы. Пожалуйста, делитесь своими идеями и предложениями, используя эту форму.


Возможности PDF

Claude работает с любым стандартным PDF. Вы можете спрашивать Claude о любом тексте, изображениях, графиках и таблицах в предоставленных PDF. Примеры использования:

  • Анализ финансовых отчетов и понимание графиков/таблиц
  • Извлечение ключевой информации из юридических документов
  • Помощь в переводе документов
  • Преобразование информации документа в структурированные форматы

Как работает поддержка PDF

Когда вы отправляете запрос, включающий PDF-файл:

1

Система извлекает содержимое документа.

  • Система преобразует каждую страницу документа в изображение.
  • Текст с каждой страницы извлекается и предоставляется вместе с изображением страницы.
2

Claude анализирует как текст, так и изображения для лучшего понимания документа.

  • Документы предоставляются как комбинация текста и изображений для анализа.
  • Это позволяет пользователям запрашивать информацию о визуальных элементах PDF, таких как графики, диаграммы и другой нетекстовый контент.
3

Используйте документы вместе с другими функциями Claude.

Поддержка PDF хорошо работает вместе с:

  • Кэширование промптов: Для улучшения производительности при повторном анализе.
  • Пакетная обработка: Для обработки большого объема документов.
  • Использование инструментов: Для извлечения конкретной информации из документов для использования в качестве входных данных инструментов.

Ограничения поддержки PDF

Перед интеграцией поддержки PDF в ваше приложение убедитесь, что ваши файлы соответствуют этим требованиям:

ТребованиеОграничение
Максимальный размер запроса32МБ
Максимальное количество страниц на запрос100
Поддерживаемые моделиclaude-3-5-sonnet-20241022, claude-3-5-sonnet-20240620

Обратите внимание, что оба ограничения относятся ко всей полезной нагрузке запроса, включая любой другой контент, отправляемый вместе с PDF. Предоставляемые PDF не должны иметь паролей или шифрования.

Поскольку поддержка PDF опирается на возможности зрения Claude, она подвержена тем же ограничениям.

Поддерживаемые платформы и модели

Поддержка PDF в настоящее время доступна на обеих моделях Claude 3.5 Sonnet (claude-3-5-sonnet-20241022, claude-3-5-sonnet-20240620) через прямой доступ к API. Эта функциональность скоро будет поддерживаться на Amazon Bedrock и Google Vertex AI.

Расчет ожидаемого использования токенов

Количество токенов PDF-файла зависит от общего текста, извлеченного из документа, а также от количества страниц. Поскольку каждая страница преобразуется в изображение, применяются те же расчеты стоимости на основе изображений. Каждая страница обычно использует от 1,500 до 3,000 токенов, в зависимости от плотности контента. Применяется стандартная цена входных токенов, без дополнительных сборов за обработку PDF.

Вы также можете использовать подсчет токенов для определения количества токенов в сообщении, содержащем PDF.


Как использовать PDF в Messages API

Вот простой пример, демонстрирующий использование PDF в Messages API:

Вот несколько других примеров, которые помогут вам начать:


Лучшие практики для анализа PDF

  • Убедитесь, что текст четкий и разборчивый.
  • Поверните страницы в правильную ориентацию.
  • При ссылке на номера страниц используйте логический номер (номер, отображаемый в вашем PDF-просмотрщике), а не физический номер страницы (номер, видимый на странице)
  • Используйте стандартные шрифты.
  • Размещайте PDF перед текстом в запросах.
  • Разделяйте очень большие PDF на меньшие части при превышении лимитов.
  • Используйте кэширование промптов для повторного анализа одного и того же документа.

Следующие шаги

Готовы начать работать с PDF используя Claude? Вот несколько полезных ресурсов: