Claude puede interactuar con entornos informáticos a través de la herramienta de uso de computadora, que proporciona capacidades de captura de pantalla y control de mouse/teclado para la interacción autónoma del escritorio.

El uso de computadora está actualmente en beta y requiere un encabezado beta:

  • "computer-use-2025-01-24" (modelos Claude 4 y 3.7)
  • "computer-use-2024-10-22" (Claude Sonnet 3.5)

Descripción general

El uso de computadora es una característica beta que permite a Claude interactuar con entornos de escritorio. Esta herramienta proporciona:

  • Captura de pantalla: Ver lo que se muestra actualmente en pantalla
  • Control de mouse: Hacer clic, arrastrar y mover el cursor
  • Entrada de teclado: Escribir texto y usar atajos de teclado
  • Automatización de escritorio: Interactuar con cualquier aplicación o interfaz

Aunque el uso de computadora puede ser aumentado con otras herramientas como bash y editor de texto para flujos de trabajo de automatización más completos, el uso de computadora se refiere específicamente a la capacidad de la herramienta de uso de computadora para ver y controlar entornos de escritorio.

Compatibilidad de modelos

El uso de computadora está disponible para los siguientes modelos de Claude:

ModeloVersión de HerramientaBandera Beta
Claude 4 Opus & Sonnetcomputer_20250124computer-use-2025-01-24
Claude Sonnet 3.7computer_20250124computer-use-2025-01-24
Claude Sonnet 3.5 (nuevo)computer_20241022computer-use-2024-10-22

Los modelos Claude 4 usan versiones de herramientas actualizadas optimizadas para la nueva arquitectura. Claude Sonnet 3.7 introduce capacidades adicionales incluyendo la característica de pensamiento para más información sobre el proceso de razonamiento del modelo.

Consideraciones de seguridad

El uso de computadora es una característica beta con riesgos únicos distintos de las características estándar de la API. Estos riesgos se intensifican al interactuar con internet. Para minimizar los riesgos, considera tomar precauciones como:

  1. Usar una máquina virtual dedicada o contenedor con privilegios mínimos para prevenir ataques directos al sistema o accidentes.
  2. Evitar dar al modelo acceso a datos sensibles, como información de inicio de sesión de cuentas, para prevenir el robo de información.
  3. Limitar el acceso a internet a una lista de dominios permitidos para reducir la exposición a contenido malicioso.
  4. Pedir a un humano que confirme decisiones que puedan resultar en consecuencias significativas del mundo real, así como cualquier tarea que requiera consentimiento afirmativo, como aceptar cookies, ejecutar transacciones financieras o aceptar términos de servicio.

En algunas circunstancias, Claude seguirá comandos encontrados en el contenido incluso si entra en conflicto con las instrucciones del usuario. Por ejemplo, las instrucciones de Claude en páginas web o contenidas en imágenes pueden anular las instrucciones o causar que Claude cometa errores. Sugerimos tomar precauciones para aislar a Claude de datos y acciones sensibles para evitar riesgos relacionados con la inyección de prompts.

Hemos entrenado al modelo para resistir estas inyecciones de prompts y hemos añadido una capa extra de defensa. Si usas nuestras herramientas de uso de computadora, ejecutaremos automáticamente clasificadores en tus prompts para marcar posibles instancias de inyecciones de prompts. Cuando estos clasificadores identifiquen posibles inyecciones de prompts en capturas de pantalla, dirigirán automáticamente al modelo a pedir confirmación del usuario antes de proceder con la siguiente acción. Reconocemos que esta protección extra no será ideal para cada caso de uso (por ejemplo, casos de uso sin un humano en el bucle), así que si quieres optar por no participar y desactivarla, por favor contáctanos.

Aún sugerimos tomar precauciones para aislar a Claude de datos y acciones sensibles para evitar riesgos relacionados con la inyección de prompts.

Finalmente, por favor informa a los usuarios finales de los riesgos relevantes y obtén su consentimiento antes de habilitar el uso de computadora en tus propios productos.

Implementación de referencia de uso de computadora

Comienza rápidamente con nuestra implementación de referencia de uso de computadora que incluye una interfaz web, contenedor Docker, implementaciones de herramientas de ejemplo y un bucle de agente.

Nota: La implementación ha sido actualizada para incluir nuevas herramientas tanto para Claude 4 como para Claude Sonnet 3.7. Asegúrate de obtener la última versión del repositorio para acceder a estas nuevas características.

Por favor usa este formulario para proporcionar retroalimentación sobre la calidad de las respuestas del modelo, la API en sí, o la calidad de la documentación - ¡no podemos esperar a escuchar de ti!

Inicio rápido

Aquí está cómo comenzar con el uso de computadora:

import anthropic

client = anthropic.Anthropic()

response = client.beta.messages.create(
    model="claude-sonnet-4-20250514",  # o otro modelo compatible
    max_tokens=1024,
    tools=[
        {
          "type": "computer_20250124",
          "name": "computer",
          "display_width_px": 1024,
          "display_height_px": 768,
          "display_number": 1,
        },
        {
          "type": "text_editor_20250124",
          "name": "str_replace_editor"
        },
        {
          "type": "bash_20250124",
          "name": "bash"
        }
    ],
    messages=[{"role": "user", "content": "Guarda una imagen de un gato en mi escritorio."}],
    betas=["computer-use-2025-01-24"]
)
print(response)

Requisitos de encabezado beta:

  • Claude 4 y Sonnet 3.7: Encabezado beta solo requerido para la herramienta de uso de computadora
  • Claude Sonnet 3.5: Encabezado beta requerido para las herramientas de computadora, bash y editor de texto

El ejemplo anterior muestra las tres herramientas siendo usadas juntas, lo que requiere el encabezado beta para cualquier modelo de Claude ya que incluye la herramienta de uso de computadora.


Cómo funciona el uso de computadora

1. Proporciona a Claude la herramienta de uso de computadora y un prompt del usuario

  • Añade la herramienta de uso de computadora (y opcionalmente otras herramientas) a tu solicitud de API.
  • Incluye un prompt del usuario que requiera interacción de escritorio, por ejemplo, “Guarda una imagen de un gato en mi escritorio.”

2. Claude decide usar la herramienta de uso de computadora

  • Claude evalúa si la herramienta de uso de computadora puede ayudar con la consulta del usuario.
  • Si es así, Claude construye una solicitud de uso de herramienta correctamente formateada.
  • La respuesta de la API tiene un stop_reason de tool_use, señalando la intención de Claude.

3. Extrae la entrada de la herramienta, evalúa la herramienta en una computadora y devuelve resultados

  • En tu lado, extrae el nombre de la herramienta y la entrada de la solicitud de Claude.
  • Usa la herramienta en un contenedor o Máquina Virtual.
  • Continúa la conversación con un nuevo mensaje de user que contenga un bloque de contenido tool_result.

4. Claude continúa llamando herramientas de uso de computadora hasta que haya completado la tarea

  • Claude analiza los resultados de la herramienta para determinar si se necesita más uso de herramientas o si la tarea ha sido completada.
  • Si Claude decide que necesita otra herramienta, responde con otro stop_reason de tool_use y debes volver al paso 3.
  • De lo contrario, elabora una respuesta de texto para el usuario.

Nos referimos a la repetición de los pasos 3 y 4 sin entrada del usuario como el “bucle de agente” - es decir, Claude respondiendo con una solicitud de uso de herramienta y tu aplicación respondiendo a Claude con los resultados de evaluar esa solicitud.

El entorno informático

El uso de computadora requiere un entorno informático aislado donde Claude pueda interactuar de manera segura con aplicaciones y la web. Este entorno incluye:

  1. Pantalla virtual: Un servidor de pantalla virtual X11 (usando Xvfb) que renderiza la interfaz de escritorio que Claude verá a través de capturas de pantalla y controlará con acciones de mouse/teclado.

  2. Entorno de escritorio: Una interfaz de usuario ligera con administrador de ventanas (Mutter) y panel (Tint2) ejecutándose en Linux, que proporciona una interfaz gráfica consistente para que Claude interactúe.

  3. Aplicaciones: Aplicaciones de Linux preinstaladas como Firefox, LibreOffice, editores de texto y administradores de archivos que Claude puede usar para completar tareas.

  4. Implementaciones de herramientas: Código de integración que traduce las solicitudes abstractas de herramientas de Claude (como “mover mouse” o “tomar captura de pantalla”) en operaciones reales en el entorno virtual.

  5. Bucle de agente: Un programa que maneja la comunicación entre Claude y el entorno, enviando las acciones de Claude al entorno y devolviendo los resultados (capturas de pantalla, salidas de comandos) de vuelta a Claude.

Cuando usas el uso de computadora, Claude no se conecta directamente a este entorno. En su lugar, tu aplicación:

  1. Recibe las solicitudes de uso de herramientas de Claude
  2. Las traduce en acciones en tu entorno informático
  3. Captura los resultados (capturas de pantalla, salidas de comandos, etc.)
  4. Devuelve estos resultados a Claude

Para seguridad y aislamiento, la implementación de referencia ejecuta todo esto dentro de un contenedor Docker con mapeos de puertos apropiados para ver e interactuar con el entorno.


Cómo implementar el uso de computadora

Comienza con nuestra implementación de referencia

Hemos construido una implementación de referencia que incluye todo lo que necesitas para comenzar rápidamente con el uso de computadora:

Entendiendo el bucle multi-agente

El núcleo del uso de computadora es el “bucle de agente” - un ciclo donde Claude solicita acciones de herramientas, tu aplicación las ejecuta y devuelve resultados a Claude. Aquí hay un ejemplo simplificado:

async def sampling_loop(
    *,
    model: str,
    messages: list[dict],
    api_key: str,
    max_tokens: int = 4096,
    tool_version: str,
    thinking_budget: int | None = None,
    max_iterations: int = 10,  # Añadir límite de iteraciones para prevenir bucles infinitos
):
    """
    Un bucle de agente simple para interacciones de uso de computadora de Claude.

    Esta función maneja el intercambio entre:
    1. Enviar mensajes de usuario a Claude
    2. Claude solicitando usar herramientas
    3. Tu aplicación ejecutando esas herramientas
    4. Enviar resultados de herramientas de vuelta a Claude
    """
    # Configurar herramientas y parámetros de API
    client = Anthropic(api_key=api_key)
    beta_flag = "computer-use-2025-01-24" if "20250124" in tool_version else "computer-use-2024-10-22"

    # Configurar herramientas - ya deberías tener estas inicializadas en otro lugar
    tools = [
        {"type": f"computer_{tool_version}", "name": "computer", "display_width_px": 1024, "display_height_px": 768},
        {"type": f"text_editor_{tool_version}", "name": "str_replace_editor"},
        {"type": f"bash_{tool_version}", "name": "bash"}
    ]

    # Bucle de agente principal (con límite de iteraciones para prevenir costos de API descontrolados)
    iterations = 0
    while True and iterations < max_iterations:
        iterations += 1
        # Configurar parámetro de pensamiento opcional (para Claude Sonnet 3.7)
        thinking = None
        if thinking_budget:
            thinking = {"type": "enabled", "budget_tokens": thinking_budget}

        # Llamar a la API de Claude
        response = client.beta.messages.create(
            model=model,
            max_tokens=max_tokens,
            messages=messages,
            tools=tools,
            betas=[beta_flag],
            thinking=thinking
        )

        # Añadir la respuesta de Claude al historial de conversación
        response_content = response.content
        messages.append({"role": "assistant", "content": response_content})

        # Verificar si Claude usó alguna herramienta
        tool_results = []
        for block in response_content:
            if block.type == "tool_use":
                # En una aplicación real, ejecutarías la herramienta aquí
                # Por ejemplo: result = run_tool(block.name, block.input)
                result = {"result": "Herramienta ejecutada exitosamente"}

                # Formatear el resultado para Claude
                tool_results.append({
                    "type": "tool_result",
                    "tool_use_id": block.id,
                    "content": result
                })

        # Si no se usaron herramientas, Claude ha terminado - devolver los mensajes finales
        if not tool_results:
            return messages

        # Añadir resultados de herramientas a los mensajes para la siguiente iteración con Claude
        messages.append({"role": "user", "content": tool_results})

El bucle continúa hasta que Claude responde sin solicitar ninguna herramienta (finalización de tarea) o se alcanza el límite máximo de iteraciones. Esta salvaguarda previene posibles bucles infinitos que podrían resultar en costos de API inesperados.

Cuando uses la herramienta de uso de computadora, debes incluir la bandera beta apropiada para tu versión de modelo:

Nota: Para Claude 4 y Sonnet 3.7, la bandera beta solo es requerida para la herramienta de uso de computadora. Para Claude Sonnet 3.5, la bandera beta es requerida para las herramientas de computadora, bash y editor de texto.

Recomendamos probar la implementación de referencia antes de leer el resto de esta documentación.

Optimiza el rendimiento del modelo con prompting

Aquí hay algunos consejos sobre cómo obtener las mejores salidas de calidad:

  1. Especifica tareas simples y bien definidas y proporciona instrucciones explícitas para cada paso.
  2. Claude a veces asume resultados de sus acciones sin verificar explícitamente sus resultados. Para prevenir esto puedes hacer prompt a Claude con Después de cada paso, toma una captura de pantalla y evalúa cuidadosamente si has logrado el resultado correcto. Muestra explícitamente tu pensamiento: "He evaluado el paso X..." Si no es correcto, inténtalo de nuevo. Solo cuando confirmes que un paso fue ejecutado correctamente debes pasar al siguiente.
  3. Algunos elementos de UI (como menús desplegables y barras de desplazamiento) pueden ser difíciles de manipular para Claude usando movimientos de mouse. Si experimentas esto, intenta hacer prompt al modelo para usar atajos de teclado.
  4. Para tareas repetibles o interacciones de UI, incluye capturas de pantalla de ejemplo y llamadas de herramientas de resultados exitosos en tu prompt.
  5. Si necesitas que el modelo inicie sesión, proporciónale el nombre de usuario y contraseña en tu prompt dentro de etiquetas xml como <robot_credentials>. Usar el uso de computadora dentro de aplicaciones que requieren inicio de sesión aumenta el riesgo de malos resultados como resultado de la inyección de prompts. Por favor revisa nuestra guía sobre mitigar inyecciones de prompts antes de proporcionar al modelo credenciales de inicio de sesión.

Si encuentras repetidamente un conjunto claro de problemas o conoces de antemano las tareas que Claude necesitará completar, usa el prompt del sistema para proporcionar a Claude consejos o instrucciones explícitas sobre cómo hacer las tareas exitosamente.

Prompts del sistema

Cuando una de las herramientas definidas por Anthropic es solicitada a través de la API de Anthropic, se genera un prompt del sistema específico para el uso de computadora. Es similar al prompt del sistema de uso de herramientas pero comienza con:

Tienes acceso a un conjunto de funciones que puedes usar para responder la pregunta del usuario. Esto incluye acceso a un entorno informático aislado. Actualmente NO tienes la capacidad de inspeccionar archivos o interactuar con recursos externos, excepto invocando las funciones de abajo.

Como con el uso regular de herramientas, el campo system_prompt proporcionado por el usuario aún se respeta y se usa en la construcción del prompt del sistema combinado.

Acciones disponibles

La herramienta de uso de computadora soporta estas acciones:

Acciones básicas (todas las versiones)

  • screenshot - Capturar la pantalla actual
  • left_click - Hacer clic en las coordenadas [x, y]
  • type - Escribir cadena de texto
  • key - Presionar tecla o combinación de teclas (por ejemplo, “ctrl+s”)
  • mouse_move - Mover cursor a coordenadas

Acciones mejoradas (computer_20250124) Disponibles en Claude 4 y Claude Sonnet 3.7:

  • scroll - Desplazarse en cualquier dirección con control de cantidad
  • left_click_drag - Hacer clic y arrastrar entre coordenadas
  • right_click, middle_click - Botones adicionales del mouse
  • double_click, triple_click - Múltiples clics
  • left_mouse_down, left_mouse_up - Control de clic de grano fino
  • hold_key - Mantener una tecla mientras se realizan otras acciones
  • wait - Pausar entre acciones

Parámetros de herramientas

ParámetroRequeridoDescripción
typeVersión de herramienta (computer_20250124 o computer_20241022)
nameDebe ser “computer”
display_width_pxAncho de pantalla en píxeles
display_height_pxAlto de pantalla en píxeles
display_numberNoNúmero de pantalla para entornos X11

Mantén la resolución de pantalla en o por debajo de 1280x800 (WXGA) para el mejor rendimiento. Resoluciones más altas pueden causar problemas de precisión debido al redimensionamiento de imágenes.

Importante: La herramienta de uso de computadora debe ser ejecutada explícitamente por tu aplicación - Claude no puede ejecutarla directamente. Eres responsable de implementar la captura de pantalla, movimientos de mouse, entradas de teclado y otras acciones basadas en las solicitudes de Claude.

Habilita la capacidad de pensamiento en Claude 4 y Claude Sonnet 3.7

Claude Sonnet 3.7 introdujo una nueva capacidad de “pensamiento” que te permite ver el proceso de razonamiento del modelo mientras trabaja en tareas complejas. Esta característica te ayuda a entender cómo Claude está abordando un problema y puede ser particularmente valiosa para depuración o propósitos educativos.

Para habilitar el pensamiento, añade un parámetro thinking a tu solicitud de API:

"thinking": {
  "type": "enabled",
  "budget_tokens": 1024
}

El parámetro budget_tokens especifica cuántos tokens puede usar Claude para pensar. Esto se resta de tu presupuesto general de max_tokens.

Cuando el pensamiento está habilitado, Claude devolverá su proceso de razonamiento como parte de la respuesta, lo que puede ayudarte a:

  1. Entender el proceso de toma de decisiones del modelo
  2. Identificar problemas potenciales o conceptos erróneos
  3. Aprender del enfoque de Claude para resolver problemas
  4. Obtener más visibilidad en operaciones complejas de múltiples pasos

Aquí hay un ejemplo de cómo podría verse la salida de pensamiento:

[Pensamiento]
Necesito guardar una imagen de un gato en el escritorio. Déjame dividir esto en pasos:

1. Primero, tomaré una captura de pantalla para ver qué hay en el escritorio
2. Luego buscaré un navegador web para buscar imágenes de gatos
3. Después de encontrar una imagen adecuada, necesitaré guardarla en el escritorio

Déjame comenzar tomando una captura de pantalla para ver qué está disponible...

Aumentando el uso de computadora con otras herramientas

La herramienta de uso de computadora puede ser combinada con otras herramientas para crear flujos de trabajo de automatización más poderosos. Esto es particularmente útil cuando necesitas:

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: computer-use-2025-01-24" \
  -d '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 2000,
    "tools": [
      {
        "type": "computer_20250124",
        "name": "computer",
        "display_width_px": 1024,
        "display_height_px": 768,
        "display_number": 1
      },
      {
        "type": "text_editor_20250124",
        "name": "str_replace_editor"
      },
      {
        "type": "bash_20250124",
        "name": "bash"
      },
      {
        "name": "get_weather",
        "description": "Obtener el clima actual en una ubicación dada",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "La ciudad y estado, por ejemplo San Francisco, CA"
            },
            "unit": {
              "type": "string",
              "enum": ["celsius", "fahrenheit"],
              "description": "La unidad de temperatura, ya sea 'celsius' o 'fahrenheit'"
            }
          },
          "required": ["location"]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Encuentra vuelos desde San Francisco a un lugar con clima más cálido."
      }
    ],
    "thinking": {
      "type": "enabled",
      "budget_tokens": 1024
    }
  }'

Construye un entorno de uso de computadora personalizado

La implementación de referencia está destinada a ayudarte a comenzar con el uso de computadora. Incluye todos los componentes necesarios para que Claude use una computadora. Sin embargo, puedes construir tu propio entorno para el uso de computadora para satisfacer tus necesidades. Necesitarás:

  • Un entorno virtualizado o en contenedor adecuado para el uso de computadora con Claude
  • Una implementación de al menos una de las herramientas de uso de computadora definidas por Anthropic
  • Un bucle de agente que interactúe con la API de Anthropic y ejecute los resultados de tool_use usando tus implementaciones de herramientas
  • Una API o UI que permita entrada del usuario para iniciar el bucle de agente

Implementa la herramienta de uso de computadora

La herramienta de uso de computadora se implementa como una herramienta sin esquema. Cuando uses esta herramienta, no necesitas proporcionar un esquema de entrada como con otras herramientas; el esquema está incorporado en el modelo de Claude y no puede ser modificado.

1

Configura tu entorno informático

Crea una pantalla virtual o conéctate a una pantalla existente con la que Claude interactuará. Esto típicamente involucra configurar Xvfb (X Virtual Framebuffer) o tecnología similar.

2

Implementa manejadores de acciones

Crea funciones para manejar cada tipo de acción que Claude podría solicitar:

def handle_computer_action(action_type, params):
    if action_type == "screenshot":
        return capture_screenshot()
    elif action_type == "left_click":
        x, y = params["coordinate"]
        return click_at(x, y)
    elif action_type == "type":
        return type_text(params["text"])
    # ... manejar otras acciones
3

Procesa las llamadas de herramientas de Claude

Extrae y ejecuta llamadas de herramientas de las respuestas de Claude:

for content in response.content:
    if content.type == "tool_use":
        action = content.input["action"]
        result = handle_computer_action(action, content.input)
        
        # Devolver resultado a Claude
        tool_result = {
            "type": "tool_result",
            "tool_use_id": content.id,
            "content": result
        }
4

Implementa el bucle de agente

Crea un bucle que continúe hasta que Claude complete la tarea:

while True:
    response = client.beta.messages.create(...)
    
    # Verificar si Claude usó alguna herramienta
    tool_results = process_tool_calls(response)
    
    if not tool_results:
        # No más uso de herramientas, tarea completa
        break
        
    # Continuar conversación con resultados de herramientas
    messages.append({"role": "user", "content": tool_results})

Maneja errores

Al implementar la herramienta de uso de computadora, pueden ocurrir varios errores. Aquí está cómo manejarlos:

Sigue las mejores prácticas de implementación


Entiende las limitaciones del uso de computadora

La funcionalidad de uso de computadora está en beta. Aunque las capacidades de Claude son de vanguardia, los desarrolladores deben estar conscientes de sus limitaciones:

  1. Latencia: la latencia actual del uso de computadora para interacciones humano-IA puede ser demasiado lenta comparada con acciones regulares de computadora dirigidas por humanos. Recomendamos enfocarse en casos de uso donde la velocidad no es crítica (por ejemplo, recopilación de información en segundo plano, pruebas automatizadas de software) en entornos confiables.
  2. Precisión y confiabilidad de visión por computadora: Claude puede cometer errores o alucinar al generar coordenadas específicas mientras genera acciones. Claude Sonnet 3.7 introduce la capacidad de pensamiento que puede ayudarte a entender el razonamiento del modelo e identificar problemas potenciales.
  3. Precisión y confiabilidad de selección de herramientas: Claude puede cometer errores o alucinar al seleccionar herramientas mientras genera acciones o tomar acciones inesperadas para resolver problemas. Adicionalmente, la confiabilidad puede ser menor al interactuar con aplicaciones de nicho o múltiples aplicaciones a la vez. Recomendamos que los usuarios hagan prompt al modelo cuidadosamente al solicitar tareas complejas.
  4. Confiabilidad de desplazamiento: Mientras que Claude Sonnet 3.5 (nuevo) tenía limitaciones con el desplazamiento, Claude Sonnet 3.7 introduce acciones de desplazamiento dedicadas con control de dirección que mejora la confiabilidad. El modelo ahora puede desplazarse explícitamente en cualquier dirección (arriba/abajo/izquierda/derecha) por una cantidad especificada.
  5. Interacción con hojas de cálculo: Los clics de mouse para interacción con hojas de cálculo han mejorado en Claude Sonnet 3.7 con la adición de acciones de control de mouse más precisas como left_mouse_down, left_mouse_up, y nuevo soporte de teclas modificadoras. La selección de celdas puede ser más confiable usando estos controles de grano fino y combinando teclas modificadoras con clics.
  6. Creación de cuentas y generación de contenido en plataformas sociales y de comunicaciones: Aunque Claude visitará sitios web, estamos limitando su capacidad para crear cuentas o generar y compartir contenido o de otra manera participar en suplantación humana a través de sitios web y plataformas de redes sociales. Podemos actualizar esta capacidad en el futuro.
  7. Vulnerabilidades: Las vulnerabilidades como jailbreaking o inyección de prompts pueden persistir a través de sistemas de IA de frontera, incluyendo la API beta de uso de computadora. En algunas circunstancias, Claude seguirá comandos encontrados en el contenido, a veces incluso en conflicto con las instrucciones del usuario. Por ejemplo, las instrucciones de Claude en páginas web o contenidas en imágenes pueden anular instrucciones o causar que Claude cometa errores. Recomendamos: a. Limitar el uso de computadora a entornos confiables como máquinas virtuales o contenedores con privilegios mínimos b. Evitar dar acceso de uso de computadora a cuentas o datos sensibles sin supervisión estricta c. Informar a los usuarios finales de los riesgos relevantes y obtener su consentimiento antes de habilitar o solicitar permisos necesarios para características de uso de computadora en tus aplicaciones
  8. Acciones inapropiadas o ilegales: Según los términos de servicio de Anthropic, no debes emplear el uso de computadora para violar ninguna ley o nuestra Política de Uso Aceptable.

Siempre revisa y verifica cuidadosamente las acciones y registros de uso de computadora de Claude. No uses Claude para tareas que requieren precisión perfecta o información sensible del usuario sin supervisión humana.


Precios

Computer use follows the standard tool use pricing. When using the computer use tool:

System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

Computer use tool token usage:

ModelInput tokens per tool definition
Claude 4 / Sonnet 3.7735 tokens
Claude Sonnet 3.5683 tokens

Additional token consumption:

  • Screenshot images (see Vision pricing)
  • Tool execution results returned to Claude

If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Próximos pasos