Computer use
O modelo Claude 3.5 Sonnet atualizado é capaz de interagir com ferramentas que podem manipular um ambiente de desktop de computador.
O uso do computador é um recurso beta. Esteja ciente de que o uso do computador apresenta riscos únicos que são distintos dos recursos padrão da API ou interfaces de bate-papo. Esses riscos são aumentados quando se usa o computador para interagir com a internet. Para minimizar os riscos, considere tomar precauções como:
- Use uma máquina virtual ou contêiner dedicado com privilégios mínimos para evitar ataques diretos ao sistema ou acidentes.
- Evite dar ao modelo acesso a dados confidenciais, como informações de login de conta, para evitar roubo de informações.
- Limite o acesso à Internet a uma lista de permissões de domínios para reduzir a exposição a conteúdo malicioso.
- Peça a um humano para confirmar decisões que possam resultar em consequências significativas no mundo real, bem como quaisquer tarefas que exijam consentimento afirmativo, como aceitar cookies, executar transações financeiras ou concordar com termos de serviço.
Em algumas circunstâncias, o Claude seguirá comandos encontrados no conteúdo, mesmo que entrem em conflito com as instruções do usuário. Por exemplo, instruções do Claude em páginas da web ou contidas em imagens podem substituir instruções ou fazer com que o Claude cometa erros. Sugerimos tomar precauções para isolar o Claude de dados e ações confidenciais para evitar riscos relacionados à injeção de prompt.
Finalmente, informe os usuários finais sobre os riscos relevantes e obtenha seu consentimento antes de habilitar o uso do computador em seus próprios produtos.
Implementação de referência do uso do computador
Comece rapidamente com nossa implementação de referência do uso do computador que inclui uma interface web, contêiner Docker, implementações de exemplo de ferramentas e um loop de agente.
Use este formulário para fornecer feedback sobre a qualidade das respostas do modelo, a própria API ou a qualidade da documentação - mal podemos esperar para ouvir você!
Aqui está um exemplo de como fornecer ferramentas de uso do computador ao Claude usando a API de Mensagens:
Como funciona o uso do computador
1. Forneça ao Claude ferramentas de uso do computador e um prompt do usuário
- Adicione ferramentas de uso do computador definidas pela Anthropic à sua solicitação da API.
- Inclua um prompt do usuário que possa exigir essas ferramentas, por exemplo, “Salve uma imagem de um gato na minha área de trabalho.”
2. O Claude decide usar uma ferramenta
- O Claude carrega as definições de ferramentas de uso do computador armazenadas e avalia se alguma ferramenta pode ajudar com a consulta do usuário.
- Se sim, o Claude constrói uma solicitação de uso de ferramenta devidamente formatada.
- A resposta da API tem um
stop_reason
detool_use
, sinalizando a intenção do Claude.
3. Extraia a entrada da ferramenta, avalie a ferramenta em um computador e retorne os resultados
- Do seu lado, extraia o nome da ferramenta e a entrada da solicitação do Claude.
- Use a ferramenta em um contêiner ou Máquina Virtual.
- Continue a conversa com uma nova mensagem
user
contendo um bloco de conteúdotool_result
.
4. O Claude continua chamando ferramentas de uso do computador até que tenha concluído a tarefa
- O Claude analisa os resultados da ferramenta para determinar se mais uso de ferramenta é necessário ou se a tarefa foi concluída.
- Se o Claude decidir que precisa de outra ferramenta, ele responderá com outro
stop_reason
detool_use
e você deve retornar à etapa 3. - Caso contrário, ele elabora uma resposta de texto para o usuário.
Nos referimos à repetição das etapas 3 e 4 sem entrada do usuário como o “loop de agente” - ou seja, o Claude respondendo com uma solicitação de uso de ferramenta e seu aplicativo respondendo ao Claude com os resultados da avaliação dessa solicitação.
Como implementar o uso do computador
Comece com nossa implementação de referência
Construímos uma implementação de referência que inclui tudo o que você precisa para começar rapidamente com o uso do computador:
- Um ambiente containerizado adequado para uso do computador com o Claude
- Implementações das ferramentas de uso do computador
- Um loop de agente que interage com a API Anthropic e executa os resultados de
tool_use
- Uma interface web para interagir com o contêiner, loop de agente e ferramentas.
Recomendamos experimentar a implementação de referência antes de ler o restante desta documentação.
Otimize o desempenho do modelo com prompt
Aqui estão algumas dicas sobre como obter as melhores saídas de qualidade:
- Especifique tarefas simples e bem definidas e forneça instruções explícitas para cada etapa.
- O Claude às vezes assume os resultados de suas ações sem verificar explicitamente seus resultados. Para evitar isso, você pode solicitar ao Claude com
Após cada etapa, tire uma captura de tela e avalie cuidadosamente se você alcançou o resultado correto. Mostre explicitamente seu raciocínio: "Eu avaliei a etapa X..." Se não estiver correto, tente novamente. Apenas quando você confirmar que uma etapa foi executada corretamente, você deve passar para a próxima.
- Alguns elementos da interface do usuário (como menus suspensos e barras de rolagem) podem ser difíceis para o Claude manipular usando movimentos do mouse. Se você tiver esse problema, tente solicitar ao modelo que use atalhos de teclado.
- Para tarefas ou interações de interface do usuário repetíveis, inclua capturas de tela de exemplo e chamadas de ferramentas de resultados bem-sucedidos em seu prompt.
- Se você precisar que o modelo faça login, forneça a ele o nome de usuário e a senha em seu prompt dentro de tags xml como
<robot_credentials>
. Usar o uso do computador dentro de aplicativos que exigem login aumenta o risco de resultados ruins como resultado da injeção de prompt. Por favor, revise nosso guia sobre mitigação de injeções de prompt antes de fornecer as credenciais de login ao modelo.
Se você encontrar repetidamente um conjunto claro de problemas ou souber antecipadamente as tarefas que o Claude precisará concluir, use o prompt do sistema para fornecer ao Claude dicas ou instruções explícitas sobre como realizar as tarefas com sucesso.
Prompts do sistema
Quando uma das ferramentas definidas pela Anthropic é solicitada através da API Anthropic, um prompt do sistema específico para uso do computador é gerado. É semelhante ao prompt do sistema de uso de ferramenta, mas começa com:
Você tem acesso a um conjunto de funções que pode usar para responder à pergunta do usuário. Isso inclui acesso a um ambiente de computação em sandbox. Você NÃO tem atualmente a capacidade de inspecionar arquivos ou interagir com recursos externos, exceto invocando as funções abaixo.
Assim como no uso regular de ferramentas, o campo system_prompt
fornecido pelo usuário ainda é respeitado e usado na construção do prompt do sistema combinado.
Entenda as ferramentas definidas pela Anthropic
Como um beta, essas definições de ferramenta estão sujeitas a alterações.
Fornecemos um conjunto de ferramentas que permitem ao Claude usar computadores de maneira eficaz. Ao especificar uma ferramenta definida pela Anthropic, os campos description
e tool_schema
não são necessários ou permitidos.
Ferramentas definidas pela Anthropic são executadas pelo usuário
As ferramentas definidas pela Anthropic são definidas pela Anthropic, mas você deve avaliar explicitamente os resultados da ferramenta e retornar os tool_results
ao Claude. Como qualquer outra ferramenta, o modelo não executa automaticamente a ferramenta.
Atualmente fornecemos 3 ferramentas definidas pela Anthropic:
{ "type": "computer_20241022", "name": "computer" }
{ "type": "text_editor_20241022", "name": "str_replace_editor" }
{ "type": "bash_20241022", "name": "bash" }
O campo type
identifica a ferramenta e seus parâmetros para fins de validação, o campo name
é o nome da ferramenta exposto ao modelo.
Se você quiser solicitar ao modelo que use uma dessas ferramentas, poderá se referir explicitamente à ferramenta pelo campo name
. O campo name
deve ser único dentro da lista de ferramentas; você não pode definir uma ferramenta com o mesmo nome que uma ferramenta definida pela Anthropic na mesma chamada de API.
Não recomendamos definir ferramentas com os nomes das ferramentas definidas pela Anthropic. Embora você ainda possa redefinir ferramentas com esses nomes (desde que o nome da ferramenta seja único em seu bloco tools
), fazer isso pode resultar em desempenho degradado do modelo.
Combine o uso do computador com outras ferramentas
Você pode combinar o uso regular de ferramentas com as ferramentas definidas pela Anthropic para uso do computador.
Construa um ambiente personalizado de uso do computador
A implementação de referência destina-se a ajudá-lo a começar com o uso do computador. Ela inclui todos os componentes necessários para que o Claude use um computador. No entanto, você pode construir seu próprio ambiente para uso do computador para atender às suas necessidades. Você precisará:
- Um ambiente virtualizado ou containerizado adequado para uso do computador com o Claude
- Uma implementação de pelo menos uma das ferramentas de uso do computador definidas pela Anthropic
*Um loop de agente que interage com a API Anthropic e executa os resultados de
tool_use
usando suas implementações de ferramentas - Uma API ou interface do usuário que permita a entrada do usuário para iniciar o loop de agente
Entenda as limitações do uso do computador
A funcionalidade de uso do computador está em beta. Embora as capacidades do Claude sejam de ponta, os desenvolvedores devem estar cientes de suas limitações:
- Latência: a latência atual do uso do computador para interações humano-IA pode ser muito lenta em comparação com ações de computador direcionadas por humanos. Recomendamos focar em casos de uso em que a velocidade não é crítica (por exemplo, coleta de informações em segundo plano, testes automatizados de software) em ambientes confiáveis.
- Precisão e confiabilidade da visão computacional: o Claude pode cometer erros ou alucinações ao gerar coordenadas específicas durante a geração de ações.
- Precisão e confiabilidade da seleção de ferramentas: o Claude pode cometer erros ou alucinações ao selecionar ferramentas durante a geração de ações ou tomar ações inesperadas para resolver problemas. Além disso, a confiabilidade pode ser menor ao interagir com aplicativos de nicho ou vários aplicativos ao mesmo tempo. Recomendamos que os usuários solicitem ao modelo cuidadosamente ao solicitar tarefas complexas.
- Confiabilidade de rolagem: a rolagem pode ser pouco confiável na experiência atual, e o modelo pode não rolar até o final de uma página de maneira confiável. O comportamento semelhante à rolagem pode ser melhorado por meio de teclas de atalho (PgUp/PgDown).
- Interação com planilhas: Cliques do mouse para interação com planilhas são pouco confiáveis. A seleção de células pode nem sempre funcionar como esperado. Isso pode ser mitigado solicitando ao modelo que use teclas de seta.
- Criação de contas e geração de conteúdo em plataformas de mídia social e comunicações: Embora o Claude visite sites, estamos limitando sua capacidade de criar contas ou gerar e compartilhar conteúdo ou se envolver em personificação humana em sites e plataformas de mídia social. Podemos atualizar esse recurso no futuro.
- Vulnerabilidades: Vulnerabilidades como jailbreaking ou injeção de prompt podem persistir em sistemas de IA de fronteira, incluindo a API beta de uso do computador. Em algumas circunstâncias, o Claude seguirá comandos encontrados no conteúdo, às vezes até em conflito com as instruções do usuário. Por exemplo, instruções do Claude em páginas da web ou contidas em imagens podem substituir instruções ou fazer com que o Claude cometa erros. Recomendamos: a. Limitar o uso do computador a ambientes confiáveis, como máquinas virtuais ou contêineres com privilégios mínimos b. Evitar dar acesso do uso do computador a contas ou dados confidenciais sem supervisão rigorosa c. Informar os usuários finais sobre os riscos relevantes e obter seu consentimento antes de habilitar ou solicitar permissões necessárias para recursos de uso do computador em seus aplicativos
- Ações inadequadas ou ilegais: De acordo com os termos de serviço da Anthropic, você não deve empregar o uso do computador para violar quaisquer leis ou nossa Política de Uso Aceitável.
Sempre revise e verifique cuidadosamente as ações e logs de uso do computador do Claude. Não use o Claude para tarefas que exijam precisão perfeita ou informações confidenciais do usuário sem supervisão humana.
Preços
Consulte a documentação de preços de uso de ferramentas para uma explicação detalhada de como as solicitações da API de Uso de Ferramentas do Claude são precificadas.
Como um subconjunto de solicitações de uso de ferramentas, as solicitações de uso do computador são precificadas da mesma forma que qualquer outra solicitação da API Claude.
Também incluímos automaticamente um prompt do sistema especial para o modelo, que habilita o uso do computador.
Modelo | Escolha de ferramenta | Contagem de tokens do prompt do sistema |
---|---|---|
Claude 3.5 Sonnet (novo) | auto any , tool | 466 tokens 499 tokens |
Além dos tokens base, os seguintes tokens de entrada adicionais são necessários para as ferramentas definidas pela Anthropic:
Ferramenta | Tokens de entrada adicionais |
---|---|
computer_20241022 | 683 tokens |
text_editor_20241022 | 700 tokens |
bash_20241022 | 245 tokens |
Was this page helpful?