Инструмент использования компьютера

Claude может взаимодействовать с компьютерными средами через инструмент использования компьютера, который предоставляет возможности создания скриншотов и управления мышью/клавиатурой для автономного взаимодействия с рабочим столом.

Использование компьютера в настоящее время находится в бета-версии и требует бета-заголовка:

"computer-use-2025-01-24" (модели Claude 4 и Claude Sonnet 3.7)
"computer-use-2024-10-22" (Claude Sonnet 3.5 (устарел))

Обзор

Использование компьютера - это бета-функция, которая позволяет Claude взаимодействовать с средами рабочего стола. Этот инструмент предоставляет:

Захват скриншотов: Видеть, что в данный момент отображается на экране
Управление мышью: Кликать, перетаскивать и перемещать курсор
Ввод с клавиатуры: Печатать текст и использовать сочетания клавиш
Автоматизация рабочего стола: Взаимодействовать с любым приложением или интерфейсом

Хотя использование компьютера может быть дополнено другими инструментами, такими как bash и текстовый редактор, для более комплексных рабочих процессов автоматизации, использование компьютера конкретно относится к способности инструмента использования компьютера видеть и управлять средами рабочего стола.

Совместимость моделей

Использование компьютера доступно для следующих моделей Claude:

Модель	Версия инструмента	Бета-флаг
Модели Claude 4	`computer_20250124`	`computer-use-2025-01-24`
Claude Sonnet 3.7	`computer_20250124`	`computer-use-2025-01-24`
Claude Sonnet 3.5 v2 (устарел)	`computer_20241022`	`computer-use-2024-10-22`

Модели Claude 4 используют обновленные версии инструментов, оптимизированные для новой архитектуры. Claude Sonnet 3.7 вводит дополнительные возможности, включая функцию мышления для большего понимания процесса рассуждения модели.

Соображения безопасности

Использование компьютера - это бета-функция с уникальными рисками, отличными от стандартных функций API. Эти риски усиливаются при взаимодействии с интернетом. Для минимизации рисков рассмотрите принятие мер предосторожности, таких как:

Используйте выделенную виртуальную машину или контейнер с минимальными привилегиями для предотвращения прямых системных атак или несчастных случаев.
Избегайте предоставления модели доступа к конфиденциальным данным, таким как информация для входа в аккаунты, для предотвращения кражи информации.
Ограничьте доступ в интернет списком разрешенных доменов для снижения воздействия вредоносного контента.
Попросите человека подтвердить решения, которые могут привести к значимым последствиям в реальном мире, а также любые задачи, требующие утвердительного согласия, такие как принятие файлов cookie, выполнение финансовых транзакций или согласие с условиями обслуживания.

В некоторых обстоятельствах Claude будет следовать командам, найденным в контенте, даже если это противоречит инструкциям пользователя. Например, инструкции Claude на веб-страницах или содержащиеся в изображениях могут переопределить инструкции или заставить Claude совершить ошибки. Мы предлагаем принимать меры предосторожности для изоляции Claude от конфиденциальных данных и действий, чтобы избежать рисков, связанных с инъекцией промптов.Мы обучили модель сопротивляться этим инъекциям промптов и добавили дополнительный уровень защиты. Если вы используете наши инструменты использования компьютера, мы автоматически запустим классификаторы на ваших промптах для выявления потенциальных случаев инъекций промптов. Когда эти классификаторы идентифицируют потенциальные инъекции промптов в скриншотах, они автоматически направят модель запросить подтверждение пользователя перед продолжением следующего действия. Мы признаем, что эта дополнительная защита не будет идеальной для каждого случая использования (например, случаи использования без человека в цикле), поэтому если вы хотите отказаться и отключить это, пожалуйста, свяжитесь с нами.Мы все еще предлагаем принимать меры предосторожности для изоляции Claude от конфиденциальных данных и действий, чтобы избежать рисков, связанных с инъекцией промптов.Наконец, пожалуйста, информируйте конечных пользователей о соответствующих рисках и получайте их согласие перед включением использования компьютера в ваших собственных продуктах.

Эталонная реализация использования компьютера

Быстро начните работу с нашей эталонной реализацией использования компьютера, которая включает веб-интерфейс, Docker-контейнер, примеры реализации инструментов и агентский цикл.Примечание: Реализация была обновлена для включения новых инструментов как для моделей Claude 4, так и для Claude Sonnet 3.7. Обязательно загрузите последнюю версию репозитория для доступа к этим новым функциям.

Пожалуйста, используйте эту форму для предоставления обратной связи о качестве ответов модели, самом API или качестве документации - мы не можем дождаться, чтобы услышать от вас!

Быстрый старт

Вот как начать работу с использованием компьютера:

import anthropic

client = anthropic.Anthropic()

response = client.beta.messages.create(
    model="claude-sonnet-4-20250514",  # или другая совместимая модель
    max_tokens=1024,
    tools=[
        {
          "type": "computer_20250124",
          "name": "computer",
          "display_width_px": 1024,
          "display_height_px": 768,
          "display_number": 1,
        },
        {
          "type": "text_editor_20250124",
          "name": "str_replace_editor"
        },
        {
          "type": "bash_20250124",
          "name": "bash"
        }
    ],
    messages=[{"role": "user", "content": "Сохрани картинку кота на мой рабочий стол."}],
    betas=["computer-use-2025-01-24"]
)
print(response)

Требования к бета-заголовку:

Модели Claude 4 и Claude Sonnet 3.7: Бета-заголовок требуется только для инструмента использования компьютера
Claude Sonnet 3.5 (устарел): Бета-заголовок требуется для инструментов компьютера, bash и текстового редактора

Приведенный выше пример показывает использование всех трех инструментов вместе, что требует бета-заголовка для любой модели Claude, поскольку включает инструмент использования компьютера.

Как работает использование компьютера

1. Предоставьте Claude инструмент использования компьютера и пользовательский промпт

Добавьте инструмент использования компьютера (и опционально другие инструменты) в ваш API-запрос.
Включите пользовательский промпт, который требует взаимодействия с рабочим столом, например, “Сохрани картинку кота на мой рабочий стол.”

2. Claude решает использовать инструмент использования компьютера

Claude оценивает, может ли инструмент использования компьютера помочь с запросом пользователя.
Если да, Claude создает правильно отформатированный запрос на использование инструмента.
API-ответ имеет stop_reason равный tool_use, сигнализируя о намерении Claude.

3. Извлеките входные данные инструмента, оцените инструмент на компьютере и верните результаты

С вашей стороны извлеките имя инструмента и входные данные из запроса Claude.
Используйте инструмент на контейнере или виртуальной машине.
Продолжите разговор с новым сообщением user, содержащим блок контента tool_result.

4. Claude продолжает вызывать инструменты использования компьютера, пока не завершит задачу

Claude анализирует результаты инструмента, чтобы определить, нужно ли больше использования инструментов или задача была завершена.
Если Claude решает, что ему нужен другой инструмент, он отвечает с другим stop_reason tool_use, и вы должны вернуться к шагу 3.
В противном случае он создает текстовый ответ пользователю.

Мы называем повторение шагов 3 и 4 без пользовательского ввода “агентским циклом” - то есть Claude отвечает запросом на использование инструмента, а ваше приложение отвечает Claude результатами оценки этого запроса.

Вычислительная среда

Использование компьютера требует изолированной вычислительной среды, где Claude может безопасно взаимодействовать с приложениями и веб. Эта среда включает:

Виртуальный дисплей: Виртуальный X11-сервер дисплея (использующий Xvfb), который отображает интерфейс рабочего стола, который Claude будет видеть через скриншоты и управлять действиями мыши/клавиатуры.
Среда рабочего стола: Легкий UI с менеджером окон (Mutter) и панелью (Tint2), работающий на Linux, который обеспечивает согласованный графический интерфейс для взаимодействия Claude.
Приложения: Предустановленные Linux-приложения, такие как Firefox, LibreOffice, текстовые редакторы и файловые менеджеры, которые Claude может использовать для выполнения задач.
Реализации инструментов: Интеграционный код, который переводит абстрактные запросы инструментов Claude (такие как “переместить мышь” или “сделать скриншот”) в фактические операции в виртуальной среде.
Агентский цикл: Программа, которая обрабатывает связь между Claude и средой, отправляя действия Claude в среду и возвращая результаты (скриншоты, выводы команд) обратно Claude.

Когда вы используете использование компьютера, Claude не подключается напрямую к этой среде. Вместо этого ваше приложение:

Получает запросы на использование инструментов Claude
Переводит их в действия в вашей вычислительной среде
Захватывает результаты (скриншоты, выводы команд и т.д.)
Возвращает эти результаты Claude

Для безопасности и изоляции эталонная реализация запускает все это внутри Docker-контейнера с соответствующими сопоставлениями портов для просмотра и взаимодействия со средой.

Как реализовать использование компьютера

Начните с нашей эталонной реализации

Мы создали эталонную реализацию, которая включает все необходимое для быстрого начала работы с использованием компьютера:

Контейнеризованная среда, подходящая для использования компьютера с Claude
Реализации инструментов использования компьютера
Агентский цикл, который взаимодействует с Anthropic API и выполняет инструменты использования компьютера
Веб-интерфейс для взаимодействия с контейнером, агентским циклом и инструментами.

Понимание мульти-агентского цикла

Ядром использования компьютера является “агентский цикл” - цикл, где Claude запрашивает действия инструментов, ваше приложение выполняет их и возвращает результаты Claude. Вот упрощенный пример:

async def sampling_loop(
    *,
    model: str,
    messages: list[dict],
    api_key: str,
    max_tokens: int = 4096,
    tool_version: str,
    thinking_budget: int | None = None,
    max_iterations: int = 10,  # Добавить лимит итераций для предотвращения бесконечных циклов
):
    """
    Простой агентский цикл для взаимодействий Claude с использованием компьютера.

    Эта функция обрабатывает обмен между:
    1. Отправкой пользовательских сообщений Claude
    2. Claude запрашивает использование инструментов
    3. Ваше приложение выполняет эти инструменты
    4. Отправкой результатов инструментов обратно Claude
    """
    # Настройка инструментов и параметров API
    client = Anthropic(api_key=api_key)
    beta_flag = "computer-use-2025-01-24" if "20250124" in tool_version else "computer-use-2024-10-22"

    # Настройка инструментов - вы должны уже инициализировать их где-то еще
    tools = [
        {"type": f"computer_{tool_version}", "name": "computer", "display_width_px": 1024, "display_height_px": 768},
        {"type": f"text_editor_{tool_version}", "name": "str_replace_editor"},
        {"type": f"bash_{tool_version}", "name": "bash"}
    ]

    # Основной агентский цикл (с лимитом итераций для предотвращения неконтролируемых затрат API)
    iterations = 0
    while True and iterations < max_iterations:
        iterations += 1
        # Настройка опционального параметра мышления (для Claude Sonnet 3.7)
        thinking = None
        if thinking_budget:
            thinking = {"type": "enabled", "budget_tokens": thinking_budget}

        # Вызов Claude API
        response = client.beta.messages.create(
            model=model,
            max_tokens=max_tokens,
            messages=messages,
            tools=tools,
            betas=[beta_flag],
            thinking=thinking
        )

        # Добавить ответ Claude в историю разговора
        response_content = response.content
        messages.append({"role": "assistant", "content": response_content})

        # Проверить, использовал ли Claude какие-либо инструменты
        tool_results = []
        for block in response_content:
            if block.type == "tool_use":
                # В реальном приложении вы бы выполнили инструмент здесь
                # Например: result = run_tool(block.name, block.input)
                result = {"result": "Инструмент выполнен успешно"}

                # Отформатировать результат для Claude
                tool_results.append({
                    "type": "tool_result",
                    "tool_use_id": block.id,
                    "content": result
                })

        # Если инструменты не использовались, Claude закончил - вернуть финальные сообщения
        if not tool_results:
            return messages

        # Добавить результаты инструментов в сообщения для следующей итерации с Claude
        messages.append({"role": "user", "content": tool_results})

Цикл продолжается до тех пор, пока либо Claude не ответит без запроса каких-либо инструментов (завершение задачи), либо не будет достигнут максимальный лимит итераций. Эта защита предотвращает потенциальные бесконечные циклы, которые могут привести к неожиданным затратам API.

При использовании инструмента использования компьютера вы должны включить соответствующий бета-флаг для вашей версии модели:

Модели Claude 4

Claude Sonnet 3.7

Claude Sonnet 3.5 v2 (устарел)

Примечание: Для моделей Claude 4 и Claude Sonnet 3.7 бета-флаг требуется только для инструмента использования компьютера. Для Claude Son net 3.5 (устарел) бета-флаг требуется для инструментов компьютера, bash и текстового редактора.

Мы рекомендуем попробовать эталонную реализацию перед чтением остальной части этой документации.

Оптимизируйте производительность модели с помощью промптинга

Вот несколько советов о том, как получить лучшие качественные выходы:

Указывайте простые, четко определенные задачи и предоставляйте явные инструкции для каждого шага.
Claude иногда предполагает результаты своих действий, не проверяя их результаты явно. Чтобы предотвратить это, вы можете подсказать Claude: После каждого шага делай скриншот и тщательно оценивай, достиг ли ты правильного результата. Явно покажи свое мышление: "Я оценил шаг X..." Если не правильно, попробуй снова. Только когда ты подтвердишь, что шаг был выполнен правильно, следует переходить к следующему.
Некоторые элементы UI (такие как выпадающие списки и полосы прокрутки) могут быть сложными для Claude для манипулирования с помощью движений мыши. Если вы испытываете это, попробуйте подсказать модели использовать сочетания клавиш.
Для повторяемых задач или взаимодействий с UI включите примеры скриншотов и вызовов инструментов успешных результатов в ваш промпт.
Если вам нужно, чтобы модель вошла в систему, предоставьте ей имя пользователя и пароль в вашем промпте внутри xml-тегов, таких как <robot_credentials>. Использование использования компьютера в приложениях, которые требуют входа в систему, увеличивает риск плохих результатов в результате инъекции промптов. Пожалуйста, ознакомьтесь с нашим руководством по смягчению инъекций промптов перед предоставлением модели учетных данных для входа.

Если вы неоднократно сталкиваетесь с четким набором проблем или заранее знаете задачи, которые Claude нужно будет выполнить, используйте системный промпт для предоставления Claude явных советов или инструкций о том, как успешно выполнять задачи.

Системные промпты

Когда один из определенных Anthropic инструментов запрашивается через Anthropic API, генерируется специфический для использования компьютера системный промпт. Он похож на системный промпт использования инструментов, но начинается с:

У вас есть доступ к набору функций, которые вы можете использовать для ответа на вопрос пользователя. Это включает доступ к изолированной вычислительной среде. В настоящее время у вас НЕТ возможности проверять файлы или взаимодействовать с внешними ресурсами, кроме как путем вызова нижеприведенных функций.

Как и при обычном использовании инструментов, предоставленное пользователем поле system_prompt все еще учитывается и используется при построении объединенного системного промпта.

Доступные действия

Инструмент использования компьютера поддерживает эти действия: Основные действия (все версии)

screenshot - Захватить текущий дисплей
left_click - Кликнуть по координатам [x, y]
type - Напечатать текстовую строку
key - Нажать клавишу или комбинацию клавиш (например, “ctrl+s”)
mouse_move - Переместить курсор к координатам

Расширенные действия (computer_20250124) Доступно в моделях Claude 4 и Claude Sonnet 3.7:

scroll - Прокручивать в любом направлении с контролем количества
left_click_drag - Кликнуть и перетащить между координатами
right_click, middle_click - Дополнительные кнопки мыши
double_click, triple_click - Множественные клики
left_mouse_down, left_mouse_up - Тонкий контроль кликов
hold_key - Удерживать клавишу при выполнении других действий
wait - Пауза между действиями

Примеры действий

// Сделать скриншот
{
  "action": "screenshot"
}

// Кликнуть в позиции
{
  "action": "left_click",
  "coordinate": [500, 300]
}

// Напечатать текст
{
  "action": "type",
  "text": "Привет, мир!"
}

// Прокрутить вниз (Claude 4/3.7)
{
  "action": "scroll",
  "coordinate": [500, 400],
  "scroll_direction": "down",
  "scroll_amount": 3
}

Параметры инструмента

Параметр	Обязательный	Описание
`type`	Да	Версия инструмента (`computer_20250124` или `computer_20241022`)
`name`	Да	Должно быть “computer”
`display_width_px`	Да	Ширина дисплея в пикселях
`display_height_px`	Да	Высота дисплея в пикселях
`display_number`	Нет	Номер дисплея для X11-сред

Держите разрешение дисплея на уровне или ниже 1280x800 (WXGA) для лучшей производительности. Более высокие разрешения могут вызвать проблемы с точностью из-за изменения размера изображения.

Важно: Инструмент использования компьютера должен быть явно выполнен вашим приложением - Claude не может выполнить его напрямую. Вы несете ответственность за реализацию захвата скриншотов, движений мыши, ввода с клавиатуры и других действий на основе запросов Claude.

Включите возможность мышления в моделях Claude 4 и Claude Sonnet 3.7

Claude Sonnet 3.7 представил новую возможность “мышления”, которая позволяет вам видеть процесс рассуждения модели при работе над сложными задачами. Эта функция помогает вам понять, как Claude подходит к проблеме, и может быть особенно ценной для отладки или образовательных целей. Чтобы включить мышление, добавьте параметр thinking в ваш API-запрос:

"thinking": {
  "type": "enabled",
  "budget_tokens": 1024
}

Параметр budget_tokens указывает, сколько токенов Claude может использовать для мышления. Это вычитается из вашего общего бюджета max_tokens. Когда мышление включено, Claude вернет свой процесс рассуждения как часть ответа, что может помочь вам:

Понять процесс принятия решений модели
Выявить потенциальные проблемы или заблуждения
Учиться на подходе Claude к решению проблем
Получить больше видимости в сложные многошаговые операции

Вот пример того, как может выглядеть вывод мышления:

[Мышление]
Мне нужно сохранить картинку кота на рабочий стол. Позвольте мне разбить это на шаги:

1. Сначала я сделаю скриншот, чтобы увидеть, что на рабочем столе
2. Затем я поищу веб-браузер для поиска изображений котов
3. После нахождения подходящего изображения мне нужно будет сохранить его на рабочий стол

Позвольте мне начать с создания скриншота, чтобы увидеть, что доступно...

Дополнение использования компьютера другими инструментами

Инструмент использования компьютера может быть объединен с другими инструментами для создания более мощных рабочих процессов автоматизации. Это особенно полезно, когда вам нужно:

Выполнять системные команды (bash инструмент)
Редактировать конфигурационные файлы или скрипты (инструмент текстового редактора)
Интегрироваться с пользовательскими API или сервисами (пользовательские инструменты)

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: computer-use-2025-01-24" \
  -d '{
    "model": "claude-opus-4-1-20250805",
    "max_tokens": 2000,
    "tools": [
      {
        "type": "computer_20250124",
        "name": "computer",
        "display_width_px": 1024,
        "display_height_px": 768,
        "display_number": 1
      },
      {
        "type": "text_editor_20250124",
        "name": "str_replace_editor"
      },
      {
        "type": "bash_20250124",
        "name": "bash"
      },
      {
        "name": "get_weather",
        "description": "Получить текущую погоду в заданном месте",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "Город и штат, например Сан-Франциско, Калифорния"
            },
            "unit": {
              "type": "string",
              "enum": ["celsius", "fahrenheit"],
              "description": "Единица температуры, либо 'celsius', либо 'fahrenheit'"
            }
          },
          "required": ["location"]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Найди рейсы из Сан-Франциско в место с более теплой погодой."
      }
    ],
    "thinking": {
      "type": "enabled",
      "budget_tokens": 1024
    }
  }'

Создайте пользовательскую среду использования компьютера

Эталонная реализация предназначена для того, чтобы помочь вам начать работу с использованием компьютера. Она включает все компоненты, необходимые для того, чтобы Claude использовал компьютер. Однако вы можете создать свою собственную среду для использования компьютера в соответствии с вашими потребностями. Вам понадобится:

Виртуализированная или контейнеризованная среда, подходящая для использования компьютера с Claude
Реализация по крайней мере одного из определенных Anthropic инструментов использования компьютера
Агентский цикл, который взаимодействует с Anthropic API и выполняет результаты tool_use с использованием ваших реализаций инструментов
API или UI, который позволяет пользовательский ввод для запуска агентского цикла

Реализуйте инструмент использования компьютера

Инструмент использования компьютера реализован как инструмент без схемы. При использовании этого инструмента вам не нужно предоставлять входную схему, как с другими инструментами; схема встроена в модель Claude и не может быть изменена.

Настройте вашу вычислительную среду

Создайте виртуальный дисплей или подключитесь к существующему дисплею, с которым будет взаимодействовать Claude. Это обычно включает настройку Xvfb (X Virtual Framebuffer) или аналогичной технологии.

Реализуйте обработчики действий

Создайте функции для обработки каждого типа действия, которое может запросить Claude:

def handle_computer_action(action_type, params):
    if action_type == "screenshot":
        return capture_screenshot()
    elif action_type == "left_click":
        x, y = params["coordinate"]
        return click_at(x, y)
    elif action_type == "type":
        return type_text(params["text"])
    # ... обработать другие действия

Обработайте вызовы инструментов Claude

Извлеките и выполните вызовы инструментов из ответов Claude:

for content in response.content:
    if content.type == "tool_use":
        action = content.input["action"]
        result = handle_computer_action(action, content.input)
        
        # Вернуть результат Claude
        tool_result = {
            "type": "tool_result",
            "tool_use_id": content.id,
            "content": result
        }

Реализуйте агентский цикл

Создайте цикл, который продолжается до тех пор, пока Claude не завершит задачу:

while True:
    response = client.beta.messages.create(...)
    
    # Проверить, использовал ли Claude какие-либо инструменты
    tool_results = process_tool_calls(response)
    
    if not tool_results:
        # Больше нет использования инструментов, задача завершена
        break
        
    # Продолжить разговор с результатами инструментов
    messages.append({"role": "user", "content": tool_results})

Обработка ошибок

При реализации инструмента использования компьютера могут возникнуть различные ошибки. Вот как их обрабатывать:

Сбой захвата скриншота

Если захват скриншота не удается, верните соответствующее сообщение об ошибке:

{
  "role": "user",
  "content": [
    {
      "type": "tool_result",
      "tool_use_id": "toolu_01A09q90qw90lq917835lq9",
      "content": "Ошибка: Не удалось захватить скриншот. Дисплей может быть заблокирован или недоступен.",
      "is_error": true
    }
  ]
}

Неверные координаты

Если Claude предоставляет координаты за пределами границ дисплея:

{
  "role": "user",
  "content": [
    {
      "type": "tool_result",
      "tool_use_id": "toolu_01A09q90qw90lq917835lq9",
      "content": "Ошибка: Координаты (1200, 900) находятся за пределами границ дисплея (1024x768).",
      "is_error": true
    }
  ]
}

Сбой выполнения действия

Если действие не удается выполнить:

{
  "role": "user",
  "content": [
    {
      "type": "tool_result",
      "tool_use_id": "toolu_01A09q90qw90lq917835lq9",
      "content": "Ошибка: Не удалось выполнить действие клика. Приложение может не отвечать.",
      "is_error": true
    }
  ]
}

Следуйте лучшим практикам реализации

Используйте подходящее разрешение дисплея

Реализуйте правильную обработку скриншотов

Добавьте задержки действий

Некоторым приложениям нужно время для ответа на действия:

def click_and_wait(x, y, wait_time=0.5):
    click_at(x, y)
    time.sleep(wait_time)  # Позволить UI обновиться

Проверяйте действия перед выполнением

Проверьте, что запрошенные действия безопасны и действительны:

def validate_action(action_type, params):
    if action_type == "left_click":
        x, y = params.get("coordinate", (0, 0))
        if not (0 <= x < display_width and 0 <= y < display_height):
            return False, "Координаты вне границ"
    return True, None

Ведите журнал действий для отладки

Ведите журнал всех действий для устранения неполадок:

import logging

def log_action(action_type, params, result):
    logging.info(f"Действие: {action_type}, Параметры: {params}, Результат: {result}")

Понимание ограничений использования компьютера

Функциональность использования компьютера находится в бета-версии. Хотя возможности Claude являются передовыми, разработчики должны знать о его ограничениях:

Задержка: текущая задержка использования компьютера для взаимодействий человек-ИИ может быть слишком медленной по сравнению с обычными действиями компьютера, направляемыми человеком. Мы рекомендуем сосредоточиться на случаях использования, где скорость не критична (например, фоновый сбор информации, автоматизированное тестирование программного обеспечения) в доверенных средах.
Точность и надежность компьютерного зрения: Claude может совершать ошибки или галлюцинировать при выводе конкретных координат при генерации действий. Claude Sonnet 3.7 вводит возможность мышления, которая может помочь вам понять рассуждения модели и выявить потенциальные проблемы.
Точность и надежность выбора инструментов: Claude может совершать ошибки или галлюцинировать при выборе инструментов при генерации действий или предпринимать неожиданные действия для решения проблем. Кроме того, надежность может быть ниже при взаимодействии с нишевыми приложениями или несколькими приложениями одновременно. Мы рекомендуем пользователям тщательно подсказывать модели при запросе сложных задач.
Надежность прокрутки: Хотя Claude Sonnet 3.5 v2 (устарел) имел ограничения с прокруткой, Claude Sonnet 3.7 вводит выделенные действия прокрутки с контролем направления, что улучшает надежность. Модель теперь может явно прокручивать в любом направлении (вверх/вниз/влево/вправо) на указанное количество.
Взаимодействие с электронными таблицами: Клики мыши для взаимодействия с электронными таблицами улучшились в Claude Sonnet 3.7 с добавлением более точных действий управления мышью, таких как left_mouse_down, left_mouse_up и новой поддержки клавиш-модификаторов. Выбор ячеек может быть более надежным при использовании этих тонких элементов управления и комбинировании клавиш-модификаторов с кликами.
Создание аккаунтов и генерация контента на социальных и коммуникационных платформах: Хотя Claude будет посещать веб-сайты, мы ограничиваем его способность создавать аккаунты или генерировать и делиться контентом или иным образом заниматься имитацией человека на веб-сайтах и платформах социальных сетей. Мы можем обновить эту возможность в будущем.
Уязвимости: Уязвимости, такие как джейлбрейкинг или инъекция промптов, могут сохраняться в передовых системах ИИ, включая бета-API использования компьютера. В некоторых обстоятельствах Claude будет следовать командам, найденным в контенте, иногда даже в конфликте с инструкциями пользователя. Например, инструкции Claude на веб-страницах или содержащиеся в изображениях могут переопределить инструкции или заставить Claude совершить ошибки. Мы рекомендуем: a. Ограничить использование компьютера доверенными средами, такими как виртуальные машины или контейнеры с минимальными привилегиями b. Избегать предоставления использованию компьютера доступа к конфиденциальным аккаунтам или данным без строгого надзора c. Информировать конечных пользователей о соответствующих рисках и получать их согласие перед включением или запросом разрешений, необходимых для функций использования компьютера в ваших приложениях
Неподходящие или незаконные действия: Согласно условиям обслуживания Anthropic, вы не должны использовать использование компьютера для нарушения каких-либо законов или нашей Политики допустимого использования.

Всегда тщательно проверяйте и верифицируйте действия и журналы использования компьютера Claude. Не используйте Claude для задач, требующих идеальной точности или конфиденциальной пользовательской информации без человеческого надзора.

Ценообразование

Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:

Model	Input tokens per tool definition
Claude 4 / Sonnet 3.7	735 tokens
Claude Sonnet 3.5 (deprecated)	683 tokens

Additional token consumption:

Screenshot images (see Vision pricing)
Tool execution results returned to Claude

If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Следующие шаги

Эталонная реализация

Быстро начните работу с нашей полной реализацией на основе Docker

Документация по инструментам

Узнайте больше об использовании инструментов и создании пользовательских инструментов

Первые шаги

Модели и цены

Узнать о Claude

Возможности

Инструменты

Протокол контекста модели (MCP)

Варианты использования

Инженерия промптов

Тестирование и оценка

Усилить защитные меры

Юридический центр

Инструмент использования компьютера

Обзор

Совместимость моделей

Соображения безопасности

Эталонная реализация использования компьютера

Быстрый старт

Как работает использование компьютера

Вычислительная среда

Как реализовать использование компьютера

Начните с нашей эталонной реализации

Понимание мульти-агентского цикла

Оптимизируйте производительность модели с помощью промптинга

Системные промпты

Доступные действия

Параметры инструмента

Включите возможность мышления в моделях Claude 4 и Claude Sonnet 3.7

Дополнение использования компьютера другими инструментами

Создайте пользовательскую среду использования компьютера

Реализуйте инструмент использования компьютера

Обработка ошибок

Следуйте лучшим практикам реализации

Понимание ограничений использования компьютера

Ценообразование

Следующие шаги

Эталонная реализация

Документация по инструментам

Первые шаги

Модели и цены

Узнать о Claude

Возможности

Инструменты

Протокол контекста модели (MCP)

Варианты использования

Инженерия промптов

Тестирование и оценка

Усилить защитные меры

Юридический центр

​Обзор

​Совместимость моделей

​Соображения безопасности

Эталонная реализация использования компьютера

​Быстрый старт

​Как работает использование компьютера

​Вычислительная среда

​Как реализовать использование компьютера

​Начните с нашей эталонной реализации

​Понимание мульти-агентского цикла

​Оптимизируйте производительность модели с помощью промптинга

​Системные промпты

​Доступные действия

​Параметры инструмента

​Включите возможность мышления в моделях Claude 4 и Claude Sonnet 3.7

​Дополнение использования компьютера другими инструментами

​Создайте пользовательскую среду использования компьютера

​Реализуйте инструмент использования компьютера

​Обработка ошибок

​Следуйте лучшим практикам реализации

​Понимание ограничений использования компьютера

​Ценообразование

​Следующие шаги

Эталонная реализация

Документация по инструментам

Обзор

Совместимость моделей

Соображения безопасности

Быстрый старт

Как работает использование компьютера

Вычислительная среда

Как реализовать использование компьютера

Начните с нашей эталонной реализации

Понимание мульти-агентского цикла

Оптимизируйте производительность модели с помощью промптинга

Системные промпты

Доступные действия

Параметры инструмента

Включите возможность мышления в моделях Claude 4 и Claude Sonnet 3.7

Дополнение использования компьютера другими инструментами

Создайте пользовательскую среду использования компьютера

Реализуйте инструмент использования компьютера

Обработка ошибок

Следуйте лучшим практикам реализации

Понимание ограничений использования компьютера

Ценообразование

Следующие шаги