Использование компьютера (бета)
Claude 4 Opus и Sonnet, а также Claude Sonnet 3.7 и Claude Sonnet 3.5 (новый), способны взаимодействовать с инструментами, которые могут управлять средой рабочего стола компьютера. Модели Claude 4 используют обновленные версии инструментов, оптимизированные для новой архитектуры. Claude Sonnet 3.7 представляет дополнительные инструменты и позволяет включить режим мышления, давая вам больше информации о процессе рассуждения модели.
Использование компьютера — это функция в бета-версии. Пожалуйста, имейте в виду, что использование компьютера создает уникальные риски, которые отличаются от стандартных функций API или интерфейсов чата. Эти риски усиливаются при использовании компьютера для взаимодействия с интернетом. Чтобы минимизировать риски, рассмотрите возможность принятия таких мер предосторожности, как:
- Использование выделенной виртуальной машины или контейнера с минимальными привилегиями для предотвращения прямых атак на систему или несчастных случаев.
- Избегайте предоставления модели доступа к конфиденциальным данным, таким как информация для входа в учетную запись, чтобы предотвратить кражу информации.
- Ограничьте доступ в интернет списком разрешенных доменов, чтобы уменьшить воздействие вредоносного контента.
- Попросите человека подтвердить решения, которые могут привести к значительным последствиям в реальном мире, а также любые задачи, требующие явного согласия, такие как принятие файлов cookie, выполнение финансовых транзакций или согласие с условиями обслуживания.
В некоторых обстоятельствах Claude будет следовать командам, найденным в контенте, даже если это противоречит инструкциям пользователя. Например, инструкции Claude на веб-страницах или содержащиеся в изображениях могут переопределить инструкции или привести к ошибкам Claude. Мы предлагаем принять меры предосторожности, чтобы изолировать Claude от конфиденциальных данных и действий, чтобы избежать рисков, связанных с инъекцией промптов.
Мы обучили модель сопротивляться этим инъекциям промптов и добавили дополнительный уровень защиты. Если вы используете наши инструменты для работы с компьютером, мы автоматически запустим классификаторы для ваших промптов, чтобы отметить потенциальные случаи инъекций промптов. Когда эти классификаторы идентифицируют потенциальные инъекции промптов на скриншотах, они автоматически направят модель запросить подтверждение пользователя перед выполнением следующего действия. Мы понимаем, что эта дополнительная защита не будет идеальной для каждого случая использования (например, для случаев использования без участия человека), поэтому если вы хотите отказаться от нее и отключить ее, пожалуйста, свяжитесь с нами.
Мы все равно предлагаем принять меры предосторожности, чтобы изолировать Claude от конфиденциальных данных и действий, чтобы избежать рисков, связанных с инъекцией промптов.
Наконец, пожалуйста, информируйте конечных пользователей о соответствующих рисках и получайте их согласие перед включением функции использования компьютера в ваших собственных продуктах.
Эталонная реализация использования компьютера
Начните быстро с нашей эталонной реализацией использования компьютера, которая включает веб-интерфейс, Docker-контейнер, примеры реализации инструментов и цикл агента.
Примечание: Реализация была обновлена, чтобы включить новые инструменты как для Claude 4, так и для Claude Sonnet 3.7. Обязательно загрузите последнюю версию репозитория, чтобы получить доступ к этим новым функциям.
Пожалуйста, используйте эту форму, чтобы предоставить отзыв о качестве ответов модели, самом API или качестве документации — мы с нетерпением ждем ваших отзывов!
Вот пример того, как предоставить инструменты использования компьютера для Claude с помощью API Messages:
Как работает использование компьютера
1. Предоставьте Claude инструменты использования компьютера и запрос пользователя
- Добавьте инструменты использования компьютера, определенные Anthropic, в ваш API-запрос.
- Включите запрос пользователя, который может потребовать эти инструменты, например, “Сохраните изображение кошки на мой рабочий стол”.
2. Claude решает использовать инструмент
- Claude загружает сохраненные определения инструментов использования компьютера и оценивает, могут ли какие-либо инструменты помочь с запросом пользователя.
- Если да, Claude создает правильно отформатированный запрос на использование инструмента.
- Ответ API имеет
stop_reason
со значениемtool_use
, сигнализирующий о намерении Claude.
3. Извлеките входные данные инструмента, оцените инструмент на компьютере и верните результаты
- На вашей стороне извлеките имя инструмента и входные данные из запроса Claude.
- Используйте инструмент в контейнере или виртуальной машине.
- Продолжите разговор с новым сообщением
user
, содержащим блок контентаtool_result
.
4. Claude продолжает вызывать инструменты использования компьютера, пока не выполнит задачу
- Claude анализирует результаты инструмента, чтобы определить, нужно ли использовать больше инструментов или задача выполнена.
- Если Claude решает, что ему нужен еще один инструмент, он отвечает с другим
stop_reason
со значениемtool_use
, и вы должны вернуться к шагу 3. - В противном случае он создает текстовый ответ пользователю.
Мы называем повторение шагов 3 и 4 без ввода пользователя “циклом агента” - то есть Claude отвечает запросом на использование инструмента, а ваше приложение отвечает Claude результатами оценки этого запроса.
Вычислительная среда
Использование компьютера требует изолированной вычислительной среды, где Claude может безопасно взаимодействовать с приложениями и веб-сайтами. Эта среда включает:
-
Виртуальный дисплей: Виртуальный сервер дисплея X11 (с использованием Xvfb), который отображает интерфейс рабочего стола, который Claude будет видеть через скриншоты и управлять с помощью действий мыши/клавиатуры.
-
Среда рабочего стола: Легкий пользовательский интерфейс с оконным менеджером (Mutter) и панелью (Tint2), работающий на Linux, который обеспечивает последовательный графический интерфейс для взаимодействия Claude.
-
Приложения: Предустановленные приложения Linux, такие как Firefox, LibreOffice, текстовые редакторы и файловые менеджеры, которые Claude может использовать для выполнения задач.
-
Реализации инструментов: Интеграционный код, который переводит абстрактные запросы инструментов Claude (например, “переместить мышь” или “сделать скриншот”) в фактические операции в виртуальной среде.
-
Цикл агента: Программа, которая обрабатывает связь между Claude и средой, отправляя действия Claude в среду и возвращая результаты (скриншоты, выводы команд) обратно Claude.
Когда вы используете функцию использования компьютера, Claude не подключается напрямую к этой среде. Вместо этого ваше приложение:
- Получает запросы на использование инструментов от Claude
- Переводит их в действия в вашей вычислительной среде
- Захватывает результаты (скриншоты, выводы команд и т.д.)
- Возвращает эти результаты Claude
Для обеспечения безопасности и изоляции эталонная реализация запускает все это внутри Docker-контейнера с соответствующими сопоставлениями портов для просмотра и взаимодействия со средой.
Как реализовать использование компьютера
Начните с нашей эталонной реализации
Мы создали эталонную реализацию, которая включает все необходимое для быстрого начала работы с использованием компьютера:
- Контейнеризированная среда, подходящая для использования компьютера с Claude
- Реализации инструментов использования компьютера
- Цикл агента, который взаимодействует с API Anthropic и выполняет инструменты использования компьютера
- Веб-интерфейс для взаимодействия с контейнером, циклом агента и инструментами.
Понимание цикла мультиагента
Основой использования компьютера является “цикл аг ента” - цикл, в котором Claude запрашивает действия инструментов, ваше приложение выполняет их и возвращает результаты Claude. Вот упрощенный пример:
Цикл продолжается до тех пор, пока либо Claude не ответит без запроса каких-либо инструментов (завершение задачи), либо не будет достигнут максимальный предел итераций. Эта защита предотвращает потенциальные бесконечные циклы, которые могут привести к неожиданным затратам на API.
Для каждой версии инструментов вы должны использовать соответствующий флаг бета в вашем API-запросе:
Мы рекомендуем попробовать эталонную реализацию перед чтением остальной части этой документации.
Оптимизация производительности модели с помощью промптов
Вот несколько советов о том, как получить наилучшее качество выходных данных:
- Указывайте простые, четко определенные задачи и предоставляйте явные инструкции для каждого шага.
- Claude иногда предполагает результаты своих действий, не проверяя их явно. Чтобы предотвратить это, вы можете дать Claude промпт:
После каждого шага сделай скриншот и тщательно оцени, достиг ли ты правильного результата. Явно покажи свои размышления: "Я оценил шаг X..." Если результат неверен, попробуй еще раз. Только когда ты подтвердишь, что шаг был выполнен правильно, переходи к следующему.
- Некоторые элементы пользовательского интерфейса (например, выпадающие списки и полосы прокрутки) могут быть сложными для Claude для манипуляции с помощью движений мыши. Если вы столкнетесь с этим, попробуйте дать модели промпт использовать сочетания клавиш.
- Для повторяющихся задач или взаимодействий с пользовательским интерфейсом включите в свой промпт примеры скриншотов и вызовов инструментов успешных результатов.
- Если вам нужно, чтобы модель вошла в систему, предоставьте ей имя пользователя и пароль в вашем промпте внутри XML-тегов, например
<robot_credentials>
. Использование компьютера в приложениях, требующих входа в систему, увеличивает риск плохих результатов в результате инъекции промптов. Пожалуйста, ознакомьтесь с нашим руководством по смягчению инъекций промптов перед предоставлением модели учетных данных для входа.
Если вы неоднократно сталкиваетесь с четким набором проблем или заранее знаете задачи, которые Claude нужно будет выполнить, используйте системный промпт, чтобы предоставить Claude явные советы или инструкции о том, как успешно выполнить задачи.
Системные промпты
Когда один из инструментов, определенных Anthropic, запрашивается через API Anthropic, генерируется системный промпт, специфичный для использования компьютера. Он похож на системный промпт для использования инструментов, но начинается с:
У вас есть доступ к набору функций, которые вы можете использовать для ответа на вопрос пользователя. Это включает доступ к изолированной вычислительной среде. В настоящее время у вас НЕТ возможности проверять файлы или взаимодействовать с внешними ресурсами, кроме как путем вызова следующих функций.
Как и при обычном использовании инструментов, поле system_prompt
, предоставленное пользователем, по-прежнему учитывается и используется при создании комбинированного системного промпта.
Понимание инструментов, определенных Anthropic
Мы предоставили набор инструментов, которые позволяют Claude эффективно использовать компьютеры. При указании инструмента, определенного Anthropic, поля description
и tool_schema
не нужны и не разрешены.
Инструменты, определенные Anthropic, выполняются пользователем
Инструменты, определенные Anthropic, определяются Anthropic, но вы должны явно оценивать результаты инструмента и возвращать tool_results
Claude. Как и с любым инструментом, модель не выполняет инструмент автоматически.
Мы предоставляем набор инструментов, определенных Anthropic, причем каждый инструмент имеет версии, оптимизированные для Claude 4, Claude Sonnet 3.7 и Claude Sonnet 3.5:
Поле type
идентифицирует инструмент и его параметры для целей проверки, поле name
- это имя инструмента, предоставляемое модели.
Если вы хотите дать модели промпт использовать один из этих инструментов, вы можете явно сослаться на инструмент по полю name
. Поле name
должно быть уникальным в списке инструментов; вы не можете определить инструмент с тем же именем, что и инструмент, определенный Anthropic, в том же вызове API.
Мы не рекомендуем определять инструменты с именами инструментов, определенных Anthropic.
Хотя вы все еще можете переопределить инструменты с этими именами (если имя инструмента
уникально в вашем блоке tools
), это может привести к ухудшению производительности модели.
Включение возможности мышления в Claude 4 и Claude Sonnet 3.7
Claude Sonnet 3.7 представил новую возможность “мышления”, которая позволяет вам видеть процесс рассуждения модели при работе над сложными задачами. Эта функция помогает вам понять, как Claude подходит к проблеме, и может быть особенно ценной для отладки или образовательных целей.
Чтобы включить мышление, добавьте параметр thinking
в ваш API-запрос:
Параметр budget_tokens
указывает, сколько токенов Claude может использовать для мышления. Это вычитается из вашего общего бюджета max_tokens
.
Когда мышление включено, Claude вернет свой процесс рассуждения как часть ответа, что может помочь вам:
- Понять процесс принятия решений модели
- Выявить потенциальные проблемы или заблуждения
- Учиться на подходе Claude к решению проблем
- Получить больше видимости в сложных многоэтапных операциях
Вот пример того, как может выглядеть вывод мышления:
Комбинирование использования компьютера с другими инструментами
Вы можете комбинировать обычное использование инструментов с инструментами, определенными Anthropic, для использования компьютера.
Создание пользовательской среды использования компьютера
Эталонная реализация предназначена для того, чтобы помочь вам начать работу с использованием компьютера. Она включает все компоненты, необходимые для того, чтобы Claude мог использовать компьютер. Однако вы можете создать свою собственную среду для использования компьютера в соответствии с вашими потребностями. Вам понадобится:
- Виртуализированная или контейнеризированная среда, подходящая для использования компьютера с Claude
- Реализация по крайней мере одного из инструментов использования компьютера, определенных Anthropic
- Цикл агента, который взаимодействует с API Anthropic и выполняет результаты
tool_use
, используя ваши реализации инструментов - API или пользовательский интерфейс, который позволяет пользовательский ввод для запуска цикла агента
Понимание ограничений использования компьютера
Функциональность использования компьютера находится в бета-версии. Хотя возможности Claude являются передовыми, разработчики должны знать о его ограничениях:
- Задержка: текущая задержка использования компьютера для взаимодействия человека и ИИ может быть слишком медленной по сравнению с обычными действиями компьютера, направляемыми человеком. Мы рекомендуем сосредоточиться на случаях использования, где скорость не критична (например, фоновый сбор информации, автоматизированное тестирование программного обеспечения) в доверенных средах.
- Точность и надежность компьютерного зрения: Claude может делать ошибки или галлюцинировать при выводе конкретных координат при генерации действий. Claude Sonnet 3.7 представляет возможность мышления, которая может помочь вам понять рассуждения модели и выявить потенциальные проблемы.
- Точность и надежность выбора инструмента: Claude может делать ошибки или галлюцинировать при выборе инструментов при генерации действий или предпринимать неожиданные действия для решения проблем. Кроме того, надежность может быть ниже при взаимодействии с нишевыми приложениями или несколькими приложениями одновременно. Мы рекомендуем пользователям тщательно формулировать запросы к модели при запросе сложных задач.
- Надежность прокрутки: Хотя Claude Sonnet 3.5 (новый) имел ограничения с прокруткой, Claude Sonnet 3.7 представляет специальные действия прокрутки с контролем направления, что улучшает надежность. Теперь модель может явно прокручивать в любом направлении (вверх/вниз/влево/вправо) на указанное количество.
- Взаимодействие с электронными таблицами: Щелчки мышью для взаимодействия с электронными таблицами улучшились в Claude Sonnet 3.7 с добавлением более точных действий управления мышью, таких как
left_mouse_down
,left_mouse_up
, и новой поддержки модификаторов клавиш. Выбор ячеек может быть более надежным при использовании этих детализированных элементов управления и комбинировании модификаторов клавиш с щелчками. - Создание учетных записей и генерация контента на социальных платформах и платформах связи: Хотя Claude будет посещать веб-сайты, мы ограничиваем его способность создавать учетные записи или генерировать и делиться контентом или иным образом заниматься имитацией человека в социальных сетях и платформах. Мы можем обновить эту возможность в будущем.
- Уязвимости: Уязвимости, такие как джейлбрейкинг или инъекция промптов, могут сохраняться в передовых системах ИИ, включая бета-API использования компьютера. В некоторых обстоятельствах Claude будет следовать командам, найденным в контенте, иногда даже в противоречии с инструкциями пользователя. Например, инструкции Claude на веб-страницах или содержащиеся в изображениях могут переопределить инструкции или привести к ошибкам Claude. Мы рекомендуем: а. Ограничить использование компьютера доверенными средами, такими как виртуальные машины или контейнеры с минимальными привилегиями б. Избегать предоставления доступа к использованию компьютера к конфиденциальным учетным записям или данным без строгого надзора в. Информировать конечных пользователей о соответствующих рисках и получать их согласие перед включением или запросом разрешений, необходимых для функций использования компьютера в ваших приложениях
- Неприемлемые или незаконные действия: Согласно условиям обслуживания Anthropic, вы не должны использовать компьютер для нарушения каких-либо законов или нашей Политики приемлемого использования.
Всегда тщательно проверяйте действия и журналы использования компьютера Claude. Не используйте Claude для задач, требующих идеальной точности или конфиденциальной информации пользователя, без надзора человека.
Ценообразование
См. документацию по ценообразованию использования инструментов для подробного объяснения того, как оцениваются запросы API Claude Tool Use.
Как подмножество запросов на использование инструментов, запросы на использование компьютера оцениваются так же, как и любой другой запрос API Claude.
Мы также автоматически включаем специальный системный промпт для модели, который включает использование компьютера.
Модель | Выбор инструмента | Количество токенов системного промпта |
---|---|---|
Claude 4 Opus & Sonnet | auto any , tool | 466 токенов 499 токенов |
Claude Sonnet 3.7 | auto any , tool | 466 токенов 499 токенов |
Claude Sonnet 3.5 (новый) | auto any , tool | 466 токенов 499 токенов |
В дополнение к базовым токенам, следующие дополнительные входные токены необходимы для инструментов, определенных Anthropic:
Инструмент | Дополнительные входные токены |
---|---|
computer_20250124 (Claude 4) | 735 токенов |
computer_20250124 (Claude Sonnet 3.7) | 735 токенов |
computer_20241022 (Claude Sonnet 3.5) | 683 токена |
text_editor_20250429 (Claude 4) | 700 токенов |
text_editor_20250124 (Claude Sonnet 3.7) | 700 токенов |
text_editor_20241022 (Claude Sonnet 3.5) | 700 токенов |
bash_20250124 (Claude 4) | 245 токенов |
bash_20250124 (Claude Sonnet 3.7) | 245 токенов |
bash_20241022 (Claude Sonnet 3.5) | 245 токенов |
Если вы включите мышление с Claude 4 или Claude Sonnet 3.7, токены, используемые для мышления, будут учитываться в вашем бюджете max_tokens
на основе budget_tokens
, которые вы указываете в параметре мышления.