Поддержка PDF (бета)
Модели Claude 3.5 Sonnet теперь поддерживают ввод PDF и понимают как текстовое, так и визуальное содержимое документов.
Поддержка PDF находится в открытой бете
Для доступа к этой функции включите заголовок anthropic-beta: pdfs-2024-09-25
в ваши API-запросы.
Мы будем улучшать эту открытую бету в течение следующих недель, поэтому ценим ваши отзывы. Пожалуйста, делитесь своими идеями и предложениями, используя эту форму.
Возможности PDF
Claude работает с любым стандартным PDF. Вы можете спрашивать Claude о любом тексте, изображениях, графиках и таблицах в предоставленных PDF. Примеры использования:
- Анализ финансовых отчетов и понимание графиков/таблиц
- Извлечение ключевой информации из юридических документов
- Помощь в переводе документов
- Преобразование информации документа в структурированные форматы
Как работает поддержка PDF
Когда вы отправляете запрос, включающий PDF-файл:
Система извлекает содержимое документа.
- Система преобразует каждую страницу документа в изображение.
- Текст с каждой страницы извлекается и предоставляется вместе с изображением страницы.
Claude анализирует как текст, так и изображения для лучшего понимания документа.
- Документы предоставляются как комбинация текста и изображений для анализа.
- Это позволяет пользователям запрашивать информацию о визуальных элементах PDF, таких как графики, диаграммы и другой нетекстовый контент.
Используйте документы вместе с другими функциями Claude.
Поддержка PDF хорошо работает вместе с:
- Кэширование промптов: Для улучшения производительности при повторном анализе.
- Пакетная обработка: Для обработки большого объема документов.
- Использование инструментов: Для извлечения конкретной информации из документов для использования в качестве входных данных инструментов.
Ограничения поддержки PDF
Перед интеграцией поддержки PDF в ваше приложение убедитесь, что ваши файлы соответствуют этим требованиям:
Требование | Ограничение |
---|---|
Максимальный размер запроса | 32МБ |
Максимальное количество страниц на запрос | 100 |
Поддерживаемые модели | claude-3-5-sonnet-20241022 , claude-3-5-sonnet-20240620 |
Обратите внимание, что оба ограничения относятся ко всей полезной нагрузке запроса, включая любой другой контент, отправляемый вместе с PDF. Предоставляемые PDF не должны иметь паролей или шифрования.
Поскольку поддержка PDF опирается на возможности зрения Claude, она подвержена тем же ограничениям.
Поддерживаемые платформы и модели
Поддержка PDF в настоящее время доступна на обеих моделях Claude 3.5 Sonnet (claude-3-5-sonnet-20241022
, claude-3-5-sonnet-20240620
) через прямой доступ к API. Эта функциональность скоро будет поддерживаться на Amazon Bedrock и Google Vertex AI.
Расчет ожидаемого использования токенов
Количество токенов PDF-файла зависит от общего текста, извлеченного из документа, а также от количества страниц. Поскольку каждая страница преобразуется в изображение, применяются те же расчеты стоимости на основе изображений. Каждая страница обычно использует от 1,500 до 3,000 токенов, в зависимости от плотности контента. Применяется стандартная цена входных токенов, без дополнительных сборов за обработку PDF.
Вы также можете использовать подсчет токенов для определения количества токенов в сообщении, содержащем PDF.
Как использовать PDF в Messages API
Вот простой пример, демонстрирующий использование PDF в Messages API:
Вот несколько других примеров, которые помогут вам начать:
Лучшие практики для анализа PDF
- Убедитесь, что текст четкий и разборчивый.
- Поверните страницы в правильную ориентацию.
- При ссылке на номера страниц используйте логический номер (номер, отображаемый в вашем PDF-просмотрщике), а не физический номер страницы (номер, видимый на странице)
- Используйте стандартные шрифты.
- Размещайте PDF перед текстом в запросах.
- Разделяйте очень большие PDF на меньшие части при превышении лимитов.
- Используйте кэширование промптов для повторного анализа одного и того же документа.
Следующие шаги
Готовы начать работать с PDF используя Claude? Вот несколько полезных ресурсов: