Claude может взаимодействовать с компьютерными средами через инструмент использования компьютера, который предоставляет возможности создания скриншотов и управления мышью/клавиатурой для автономного взаимодействия с рабочим столом.
"computer-use-2025-01-24"
(модели Claude 4 и Claude Sonnet 3.7)"computer-use-2024-10-22"
(Claude Sonnet 3.5 (устарел))Модель | Версия инструмента | Бета-флаг |
---|---|---|
Модели Claude 4 | computer_20250124 | computer-use-2025-01-24 |
Claude Sonnet 3.7 | computer_20250124 | computer-use-2025-01-24 |
Claude Sonnet 3.5 v2 (устарел) | computer_20241022 | computer-use-2024-10-22 |
1. Предоставьте Claude инструмент использования компьютера и пользовательский промпт
2. Claude решает использовать инструмент использования компьютера
stop_reason
равный tool_use
, сигнализируя о намерении Claude.3. Извлеките входные данные инструмента, оцените инструмент на компьютере и верните результаты
user
, содержащим блок контента tool_result
.4. Claude продолжает вызывать инструменты использования компьютера, пока не завершит задачу
stop_reason
tool_use
, и вы должны вернуться к шагу 3.Модели Claude 4
computer_20250124
включите этот бета-флаг:Claude Sonnet 3.7
computer_20250124
включите этот бета-флаг:Claude Sonnet 3.5 v2 (устарел)
computer_20241022
включите этот бета-флаг:После каждого шага делай скриншот и тщательно оценивай, достиг ли ты правильного результата. Явно покажи свое мышление: "Я оценил шаг X..." Если не правильно, попробуй снова. Только когда ты подтвердишь, что шаг был выполнен правильно, следует переходить к следующему.
<robot_credentials>
. Использование использования компьютера в приложениях, которые требуют входа в систему, увеличивает риск плохих результатов в результате инъекции промптов. Пожалуйста, ознакомьтесь с нашим руководством по смягчению инъекций промптов перед предоставлением модели учетных данных для входа.У вас есть доступ к набору функций, которые вы можете использовать для ответа на вопрос пользователя. Это включает доступ к изолированной вычислительной среде. В настоящее время у вас НЕТ возможности проверять файлы или взаимодействовать с внешними ресурсами, кроме как путем вызова нижеприведенных функций.Как и при обычном использовании инструментов, предоставленное пользователем поле
system_prompt
все еще учитывается и используется при построении объединенного системного промпта.
[x, y]
computer_20250124
)
Доступно в моделях Claude 4 и Claude Sonnet 3.7:
Примеры действий
Параметр | Обязательный | Описание |
---|---|---|
type | Да | Версия инструмента (computer_20250124 или computer_20241022 ) |
name | Да | Должно быть “computer” |
display_width_px | Да | Ширина дисплея в пикселях |
display_height_px | Да | Высота дисплея в пикселях |
display_number | Нет | Номер дисплея для X11-сред |
thinking
в ваш API-запрос:
budget_tokens
указывает, сколько токенов Claude может использовать для мышления. Это вычитается из вашего общего бюджета max_tokens
.
Когда мышление включено, Claude вернет свой процесс рассуждения как часть ответа, что может помочь вам:
tool_use
с использованием ваших реализаций инструментовНастройте вашу вычислительную среду
Реализуйте обработчики действий
Обработайте вызовы инструментов Claude
Реализуйте агентский цикл
Сбой захвата скриншота
Неверные координаты
Сбой выполнения действия
Используйте подходящее разрешение дисплея
Реализуйте правильную обработку скриншотов
Добавьте задержки действий
Проверяйте действия перед выполнением
Ведите журнал действий для отладки
left_mouse_down
, left_mouse_up
и новой поддержки клавиш-модификаторов. Выбор ячеек может быть более надежным при использовании этих тонких элементов управления и комбинировании клавиш-модификаторов с кликами.Model | Input tokens per tool definition |
---|---|
Claude 4 / Sonnet 3.7 | 735 tokens |
Claude Sonnet 3.5 (deprecated) | 683 tokens |