Инструмент веб-загрузки
Инструмент веб-загрузки позволяет Claude получать полное содержимое с указанных веб-страниц и PDF-документов.
Инструмент веб-загрузки позволяет Claude получать полное содержимое с указанных веб-страниц и PDF-документов.
Инструмент веб-загрузки в настоящее время находится в бета-версии. Чтобы включить его, используйте бета-заголовок web-fetch-2025-09-10
в ваших API-запросах.
Пожалуйста, используйте эту форму для предоставления отзывов о качестве ответов модели, самом API или качестве документации.
Включение инструмента веб-загрузки в средах, где Claude обрабатывает недоверенный ввод наряду с конфиденциальными данными, создает риски утечки данных. Мы рекомендуем использовать этот инструмент только в доверенных средах или при работе с неконфиденциальными данными.
Чтобы минимизировать риски утечки, Claude не разрешается динамически создавать URL. Claude может загружать только URL, которые были явно предоставлены пользователем или которые поступили из предыдущих результатов веб-поиска или веб-загрузки. Однако остается остаточный риск, который следует тщательно учитывать при использовании этого инструмента.
Если утечка данных вызывает беспокойство, рассмотрите:
- Полное отключение инструмента веб-загрузки
- Использование параметра
max_uses
для ограничения количества запросов - Использование параметра
allowed_domains
для ограничения известными безопасными доменами
Поддерживаемые модели
Веб-загрузка доступна на:
- Claude Opus 4.1 (
claude-opus-4-1-20250805
) - Claude Opus 4 (
claude-opus-4-20250514
) - Claude Sonnet 4 (
claude-sonnet-4-20250514
) - Claude Sonnet 3.7 (
claude-3-7-sonnet-20250219
) - Claude Sonnet 3.5 v2 (устарела) (
claude-3-5-sonnet-latest
) - Claude Haiku 3.5 (
claude-3-5-haiku-latest
)
Как работает веб-загрузка
Когда вы добавляете инструмент веб-загрузки в ваш API-запрос:
- Claude решает, когда загружать содержимое, основываясь на промпте и доступных URL.
- API получает полное текстовое содержимое с указанного URL.
- Для PDF выполняется автоматическое извлечение текста.
- Claude анализирует загруженное содержимое и предоставляет ответ с необязательными цитатами.
Как использовать веб-загрузку
Предоставьте инструмент веб-загрузки в вашем API-запросе:
Определение инструмента
Инструмент веб-загрузки поддерживает следующие параметры:
Максимальное использование
Параметр max_uses
ограничивает количество выполняемых веб-загрузок. Если Claude попытается выполнить больше загрузок, чем разрешено, web_fetch_tool_result
будет ошибкой с кодом ошибки max_uses_exceeded
. В настоящее время нет ограничения по умолчанию.
Фильтрация доменов
При использовании фильтров доменов:
- Домены не должны включать схему HTTP/HTTPS (используйте
example.com
вместоhttps://example.com
) - Поддомены автоматически включаются (
example.com
покрываетdocs.example.com
) - Поддерживаются подпути (
example.com/blog
) - Вы можете использовать либо
allowed_domains
, либоblocked_domains
, но не оба в одном запросе.
Имейте в виду, что символы Unicode в доменных именах могут создавать уязвимости безопасности через атаки гомографов, где визуально похожие символы из разных скриптов могут обойти фильтры доменов. Например, аmazon.com
(используя кириллическую ‘а’) может выглядеть идентично amazon.com
, но представляет другой домен.
При настройке списков разрешенных/заблокированных доменов:
- Используйте доменные имена только в ASCII, когда это возможно
- Учитывайте, что парсеры URL могут по-разному обрабатывать нормализацию Unicode
- Тестируйте ваши фильтры доменов с потенциальными вариациями гомографов
- Регулярно проверяйте ваши конфигурации доменов на подозрительные символы Unicode
Ограничения содержимого
Параметр max_content_tokens
ограничивает количество содержимого, которое будет включено в контекст. Если загруженное содержимое превышает этот лимит, оно будет обрезано. Это помогает контролировать использование токенов при загрузке больших документов.
Лимит параметра max_content_tokens
является приблизительным. Фактическое количество используемых входных токенов может незначительно варьироваться.
Цитаты
В отличие от веб-поиска, где цитаты всегда включены, цитаты для веб-загрузки необязательны. Установите "citations": {"enabled": true}
, чтобы позволить Claude цитировать конкретные отрывки из загруженных документов.
При отображении веб-результатов или информации, содержащейся в веб-результатах, конечным пользователям, встроенные цитаты должны быть четко видимыми и кликабельными в вашем пользовательском интерфейсе.
Ответ
Вот пример структуры ответа:
Результаты загрузки
Результаты загрузки включают:
url
: URL, который был загруженcontent
: Блок документа, содержащий загруженное содержимоеretrieved_at
: Временная метка, когда содержимое было получено
Инструмент веб-загрузки кэширует результаты для улучшения производительности и уменьшения избыточных запросов. Это означает, что возвращаемое содержимое может не всегда быть последней версией, доступной по URL. Поведение кэша управляется автоматически и может изменяться со временем для оптимизации различных типов содержимого и шаблонов использования.
Для PDF-документов содержимое будет возвращено как данные в кодировке base64:
Ошибки
Когда инструмент веб-загрузки сталкивается с ошибкой, Anthropic API возвращает ответ 200 (успех) с ошибкой, представленной в теле ответа:
Это возможные коды ошибок:
invalid_input
: Неверный формат URLurl_too_long
: URL превышает максимальную длину (250 символов)url_not_allowed
: URL заблокирован правилами фильтрации доменов и ограничениями моделиurl_not_accessible
: Не удалось загрузить содержимое (ошибка HTTP)too_many_requests
: Превышен лимит скоростиunsupported_content_type
: Тип содержимого не поддерживается (только текст и PDF)max_uses_exceeded
: Превышено максимальное использование инструмента веб-загрузкиunavailable
: Произошла внутренняя ошибка
Валидация URL
По соображениям безопасности инструмент веб-загрузки может загружать только URL, которые ранее появлялись в контексте разговора. Это включает:
- URL в сообщениях пользователя
- URL в результатах клиентских инструментов
- URL из предыдущих результатов веб-поиска или веб-загрузки
Инструмент не может загружать произвольные URL, которые генерирует Claude, или URL из серверных инструментов на основе контейнеров (выполнение кода, Bash и т.д.).
Комбинированный поиск и загрузка
Веб-загрузка работает бесшовно с веб-поиском для комплексного сбора информации:
В этом рабочем процессе Claude будет:
- Использовать веб-поиск для поиска релевантных статей
- Выбирать наиболее перспективные результаты
- Использовать веб-загрузку для получения полного содержимого
- Предоставлять подробный анализ с цитатами
Кэширование промптов
Веб-загрузка работает с кэшированием промптов. Чтобы включить кэширование промптов, добавьте точки останова cache_control
в ваш запрос. Кэшированные результаты загрузки могут быть повторно использованы в разных поворотах разговора.
Потоковая передача
При включенной потоковой передаче события загрузки являются частью потока с паузой во время получения содержимого:
Пакетные запросы
Вы можете включить инструмент веб-загрузки в API пакетных сообщений. Вызовы инструмента веб-загрузки через API пакетных сообщений оцениваются так же, как и в обычных запросах API сообщений.
Использование и ценообразование
Web fetch usage has no additional charges beyond standard token costs:
The web fetch tool is available on the Anthropic API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.
To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens
parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
- Average web page (10KB): ~2,500 tokens
- Large documentation page (100KB): ~25,000 tokens
- Research paper PDF (500KB): ~125,000 tokens