Computer use
El modelo mejorado Claude 3.5 Sonnet es capaz de interactuar con herramientas que pueden manipular un entorno de escritorio de computadora.
El uso de computadora es una función beta. Tenga en cuenta que el uso de computadora conlleva riesgos únicos que son distintos de las funciones estándar de la API o las interfaces de chat. Estos riesgos se ven aumentados cuando se usa el uso de computadora para interactuar con Internet. Para minimizar los riesgos, considere tomar precauciones como:
- Utilice una máquina virtual o contenedor dedicado con privilegios mínimos para evitar ataques directos al sistema o accidentes.
- Evite dar al modelo acceso a datos sensibles, como información de inicio de sesión de cuentas, para evitar el robo de información.
- Limite el acceso a Internet a una lista de dominios permitidos para reducir la exposición a contenido malicioso.
- Pida a un humano que confirme las decisiones que puedan resultar en consecuencias significativas en el mundo real, así como cualquier tarea que requiera consentimiento afirmativo, como aceptar cookies, ejecutar transacciones financieras o aceptar términos de servicio.
En algunas circunstancias, Claude seguirá los comandos encontrados en el contenido, incluso si entran en conflicto con las instrucciones del usuario. Por ejemplo, las instrucciones de Claude en páginas web o contenidas en imágenes pueden anular las instrucciones o hacer que Claude cometa errores. Sugerimos tomar precauciones para aislar a Claude de datos y acciones sensibles para evitar riesgos relacionados con la inyección de indicaciones.
Finalmente, informe a los usuarios finales sobre los riesgos relevantes y obtenga su consentimiento antes de habilitar el uso de computadora en sus propios productos.
Comience rápidamente con nuestra implementación de referencia de uso de computadora que incluye una interfaz web, un contenedor Docker, implementaciones de herramientas de ejemplo y un bucle de agente.
¡Utilice este formulario para proporcionar comentarios sobre la calidad de las respuestas del modelo, la API en sí o la calidad de la documentación - no podemos esperar a escuchar de usted!
Aquí hay un ejemplo de cómo proporcionar herramientas de uso de computadora a Claude usando la API de Mensajes:
Cómo funciona el uso de computadora
- Agregue herramientas de uso de computadora definidas por Anthropic a su solicitud de API.
- Incluya una indicación de usuario que pueda requerir estas herramientas, por ejemplo, “Guarda una imagen de un gato en mi escritorio”.
- Claude carga las definiciones de herramientas de uso de computadora almacenadas y evalúa si alguna herramienta puede ayudar con la consulta del usuario.
- Si es así, Claude construye una solicitud de uso de herramienta con el formato adecuado.
- La respuesta de la API tiene un
stop_reason
detool_use
, señalando la intención de Claude.
- En su lado, extraiga el nombre de la herramienta y la entrada de la solicitud de Claude.
- Use la herramienta en un contenedor o máquina virtual.
- Continúe la conversación con un nuevo mensaje de
usuario
que contenga un bloque de contenidotool_result
.
- Claude analiza los resultados de la herramienta para determinar si se necesita más uso de herramientas o si se ha completado la tarea.
- Si Claude decide que necesita otra herramienta, responde con otro
stop_reason
detool_use
y usted debe volver al paso 3. - De lo contrario, elabora una respuesta de texto para el usuario.
Nos referimos a la repetición de los pasos 3 y 4 sin entrada del usuario como el “bucle de agente”, es decir, Claude respondiendo con una solicitud de uso de herramienta y su aplicación respondiendo a Claude con los resultados de evaluar esa solicitud.
Cómo implementar el uso de computadora
Comience con nuestra implementación de referencia
Hemos construido una implementación de referencia que incluye todo lo que necesita para comenzar rápidamente con el uso de computadora:
- Un entorno containerizado adecuado para el uso de computadora con Claude
- Implementaciones de las herramientas de uso de computadora
- Un bucle de agente que interactúa con la API de Anthropic y ejecuta los resultados de uso de herramientas
- Una interfaz web para interactuar con el contenedor, el bucle de agente y las herramientas.
Recomendamos probar la implementación de referencia antes de leer el resto de esta documentación.
Optimice el rendimiento del modelo con indicaciones
Aquí hay algunos consejos sobre cómo obtener los mejores resultados de calidad:
- Especifique tareas simples y bien definidas y proporcione instrucciones explícitas para cada paso.
- A veces, Claude asume los resultados de sus acciones sin verificar explícitamente sus resultados. Para evitar esto, puede indicar a Claude con
Después de cada paso, tome una captura de pantalla y evalúe cuidadosamente si ha logrado el resultado correcto. Muestre explícitamente su pensamiento: "He evaluado el paso X..." Si no es correcto, inténtelo de nuevo. Solo cuando confirme que se ejecutó correctamente un paso, debe pasar al siguiente
. - Algunos elementos de la interfaz de usuario (como menús desplegables y barras de desplazamiento) pueden ser difíciles para Claude de manipular con movimientos del mouse. Si experimenta esto, intente indicar al modelo que use atajos de teclado.
- Para tareas o interacciones de interfaz de usuario repetibles, incluya capturas de pantalla de ejemplo y llamadas de herramientas de resultados exitosos en su indicación.
- Si necesita que el modelo inicie sesión, proporciónele el nombre de usuario y la contraseña en su indicación dentro de etiquetas xml como
<robot_credentials>
. El uso de computadora dentro de aplicaciones que requieren inicio de sesión aumenta el riesgo de malos resultados como resultado de la inyección de indicaciones. Revise nuestra guía sobre mitigación de inyecciones de indicaciones antes de proporcionar al modelo credenciales de inicio de sesión.
Si encuentra repetidamente un conjunto claro de problemas o sabe de antemano las tareas que Claude deberá completar, use la indicación del sistema para proporcionar a Claude consejos o instrucciones explícitas sobre cómo realizar las tareas con éxito.
Indicaciones del sistema
Cuando se solicita una de las herramientas definidas por Anthropic a través de la API de Anthropic, se genera una indicación del sistema específica para el uso de computadora. Es similar a la indicación del sistema de uso de herramientas pero comienza con:
Tiene acceso a un conjunto de funciones que puede usar para responder la pregunta del usuario. Esto incluye acceso a un entorno informático aislado. ACTUALMENTE NO tiene la capacidad de inspeccionar archivos o interactuar con recursos externos, excepto invocando las funciones a continuación.
Al igual que con el uso regular de herramientas, se respeta y se utiliza el campo system_prompt
proporcionado por el usuario en la construcción de la indicación del sistema combinada.
Comprenda las herramientas definidas por Anthropic
Como beta, estas definiciones de herramientas están sujetas a cambios.
Hemos proporcionado un conjunto de herramientas que permiten a Claude usar computadoras de manera efectiva. Al especificar una herramienta definida por Anthropic, los campos description
y tool_schema
no son necesarios ni permitidos.
Las herramientas definidas por Anthropic son ejecutadas por el usuario
Las herramientas definidas por Anthropic están definidas por Anthropic, pero usted debe evaluar explícitamente los resultados de la herramienta y devolver los tool_results
a Claude. Al igual que con cualquier herramienta, el modelo no ejecuta automáticamente la herramienta.
Actualmente proporcionamos 3 herramientas definidas por Anthropic:
{ "type": "computer_20241022", "name": "computer" }
{ "type": "text_editor_20241022", "name": "str_replace_editor" }
{ "type": "bash_20241022", "name": "bash" }
El campo type
identifica la herramienta y sus parámetros para fines de validación, el campo name
es el nombre de la herramienta expuesto al modelo.
Si desea indicar al modelo que use una de estas herramientas, puede referirse explícitamente a la herramienta por el campo name
. El campo name
debe ser único dentro de la lista de herramientas; no puede definir una herramienta con el mismo nombre que una herramienta definida por Anthropic en la misma llamada de API.
No recomendamos definir herramientas con los nombres de las herramientas definidas por Anthropic. Si bien puede volver a definir herramientas con estos nombres (siempre que el nombre de la herramienta sea único en su bloque tools
), hacerlo puede resultar en un rendimiento degradado del modelo.
Combine el uso de computadora con otras herramientas
Puede combinar el uso regular de herramientas con las herramientas definidas por Anthropic para el uso de computadora.
Construya un entorno de uso de computadora personalizado
La implementación de referencia está destinada a ayudarlo a comenzar con el uso de computadora. Incluye todos los componentes necesarios para que Claude use una computadora. Sin embargo, puede construir su propio entorno para el uso de computadora para adaptarse a sus necesidades. Necesitará:
- Un entorno virtualizado o containerizado adecuado para el uso de computadora con Claude
- Una implementación de al menos una de las herramientas de uso de computadora definidas por Anthropic
- Un bucle de agente que interactúe con la API de Anthropic y ejecute los resultados de
tool_use
utilizando sus implementaciones de herramientas - Una API o interfaz de usuario que permita la entrada del usuario para iniciar el bucle de agente
Comprenda las limitaciones del uso de computadora
La funcionalidad de uso de computadora está en beta. Si bien las capacidades de Claude son de vanguardia, los desarrolladores deben conocer sus limitaciones:
- Latencia: la latencia actual del uso de computadora para interacciones humano-IA puede ser demasiado lenta en comparación con las acciones de computadora dirigidas por humanos regulares. Recomendamos enfocarse en casos de uso donde la velocidad no es crítica (por ejemplo, recopilación de información en segundo plano, pruebas automatizadas de software) en entornos de confianza.
- Precisión y confiabilidad de la visión por computadora: Claude puede cometer errores o alucinaciones al generar coordenadas específicas mientras genera acciones.
- Precisión y confiabilidad de la selección de herramientas: Claude puede cometer errores o alucinaciones al seleccionar herramientas mientras genera acciones o tomar acciones inesperadas para resolver problemas. Además, la confiabilidad puede ser menor cuando se interactúa con aplicaciones de nicho o múltiples aplicaciones a la vez. Recomendamos que los usuarios indiquen al modelo cuidadosamente cuando soliciten tareas complejas.
- Confiabilidad del desplazamiento: El desplazamiento puede no ser confiable en la experiencia actual, y es posible que el modelo no se desplace de manera confiable hasta el final de una página. El comportamiento similar al desplazamiento se puede mejorar mediante atajos de teclado (PgUp/PgDown).
- Interacción con hojas de cálculo: Los clics del mouse para la interacción con hojas de cálculo no son confiables. La selección de celdas puede no funcionar siempre como se espera. Esto se puede mitigar indicando al modelo que use las teclas de flecha.
- Creación de cuentas y generación de contenido en plataformas sociales y de comunicaciones: Si bien Claude visitará sitios web, estamos limitando su capacidad para crear cuentas o generar y compartir contenido o participar en la suplantación de humanos en sitios web y plataformas de redes sociales. Es posible que actualicemos esta capacidad en el futuro.
- Vulnerabilidades: Las vulnerabilidades como el jailbreaking o la inyección de indicaciones pueden persistir en los sistemas de IA de vanguardia, incluida la API beta de uso de computadora. En algunas circunstancias, Claude seguirá los comandos encontrados en el contenido, a veces incluso en conflicto con las instrucciones del usuario. Por ejemplo, las instrucciones de Claude en páginas web o contenidas en imágenes pueden anular las instrucciones o hacer que Claude cometa errores. Recomendamos: a. Limitar el uso de computadora a entornos de confianza, como máquinas virtuales o contenedores con privilegios mínimos b. Evitar dar acceso de uso de computadora a cuentas o datos sensibles sin una supervisión estricta c. Informar a los usuarios finales sobre los riesgos relevantes y obtener su consentimiento antes de habilitar o solicitar los permisos necesarios para las funciones de uso de computadora en sus aplicaciones
- Acciones inapropiadas o ilegales: Según los términos de servicio de Anthropic, no debe emplear el uso de computadora para violar ninguna ley o nuestra Política de uso aceptable.
Siempre revise y verifique cuidadosamente las acciones y registros de uso de computadora de Claude. No use Claude para tareas que requieran precisión perfecta o información de usuario sensible sin supervisión humana.
Precios
Consulte la documentación de precios de uso de herramientas para obtener una explicación detallada de cómo se facturan las solicitudes de la API de uso de herramientas de Claude.
Como un subconjunto de las solicitudes de uso de herramientas, las solicitudes de uso de computadora se facturan de la misma manera que cualquier otra solicitud de la API de Claude.
También incluimos automáticamente una indicación del sistema especial para el modelo, que habilita el uso de computadora.
Modelo | Elección de herramienta | Recuento de tokens de indicación del sistema |
---|---|---|
Claude 3.5 Sonnet (nuevo) | auto any , tool | 466 tokens 499 tokens |
Además de los tokens base, se necesitan los siguientes tokens de entrada adicionales para las herramientas definidas por Anthropic:
Herramienta | Tokens de entrada adicionales |
---|---|
computer_20241022 | 683 tokens |
text_editor_20241022 | 700 tokens |
bash_20241022 | 245 tokens |
Was this page helpful?