Utilisation de l'ordinateur (bêta)
Le modèle amélioré Claude 3.5 Sonnet est capable d’interagir avec des outils qui peuvent manipuler un environnement de bureau informatique.
Le modèle amélioré Claude 3.5 Sonnet est capable d’interagir avec des outils qui peuvent manipuler un environnement de bureau informatique.
L’utilisation de l’ordinateur est une fonctionnalité bêta. Veuillez noter que l’utilisation de l’ordinateur présente des risques uniques qui sont distincts des fonctionnalités standard de l’API ou des interfaces de chat. Ces risques sont accrus lors de l’utilisation de l’ordinateur pour interagir avec Internet. Pour minimiser les risques, envisagez de prendre des précautions telles que :
- Utilisez une machine virtuelle ou un conteneur dédié avec des privilèges minimaux pour éviter les attaques système directes ou les accidents.
- Évitez de donner au modèle accès à des données sensibles, telles que des informations de connexion de compte, pour éviter le vol d’informations.
- Limitez l’accès à Internet à une liste blanche de domaines pour réduire l’exposition aux contenus malveillants.
- Demandez à un humain de confirmer les décisions pouvant entraîner des conséquences significatives dans le monde réel ainsi que toute tâche nécessitant un consentement affirmatif, comme l’acceptation de cookies, l’exécution de transactions financières ou l’acceptation de conditions d’utilisation.
Dans certaines circonstances, Claude suivra les commandes trouvées dans le contenu, même si elles entrent en conflit avec les instructions de l’utilisateur. Par exemple, les instructions de Claude sur les pages Web ou contenues dans les images peuvent remplacer les instructions ou amener Claude à commettre des erreurs. Nous vous suggérons de prendre des précautions pour isoler Claude des données et des actions sensibles afin d’éviter les risques liés à l’injection de prompts.
Enfin, veuillez informer les utilisateurs finaux des risques pertinents et obtenez leur consentement avant d’activer l’utilisation de l’ordinateur dans vos propres produits.
Implémentation de référence de l'utilisation de l'ordinateur
Commencez rapidement avec notre implémentation de référence de l’utilisation de l’ordinateur qui comprend une interface Web, un conteneur Docker, des implémentations d’outils d’exemple et une boucle d’agent.
Veuillez utiliser ce formulaire pour fournir vos commentaires sur la qualité des réponses du modèle, de l’API elle-même ou de la qualité de la documentation - nous avons hâte d’avoir de vos nouvelles !
Voici un exemple de la façon de fournir des outils d’utilisation de l’ordinateur à Claude en utilisant l’API Messages :
Comment fonctionne l’utilisation de l’ordinateur
1. Fournissez à Claude des outils d'utilisation de l'ordinateur et une invite utilisateur
- Ajoutez les outils d’utilisation de l’ordinateur définis par Anthropic à votre requête API.
- Incluez une invite utilisateur qui pourrait nécessiter ces outils, par exemple “Enregistrez une image d’un chat sur mon bureau”.
2. Claude décide d'utiliser un outil
- Claude charge les définitions d’outils d’utilisation de l’ordinateur stockées et évalue si l’un des outils peut l’aider avec la requête de l’utilisateur.
- Si oui, Claude construit une requête d’utilisation d’outil correctement formatée.
- La réponse de l’API a une
stop_reason
detool_use
, signalant l’intention de Claude.
3. Extrayez l'entrée de l'outil, évaluez l'outil sur un ordinateur et renvoyez les résultats
- De votre côté, extrayez le nom de l’outil et l’entrée de la requête de Claude.
- Utilisez l’outil sur un conteneur ou une machine virtuelle.
- Continuez la conversation avec un nouveau message
user
contenant un bloc de contenutool_result
.
4. Claude continue d'appeler les outils d'utilisation de l'ordinateur jusqu'à ce qu'il ait terminé la tâche
- Claude analyse les résultats de l’outil pour déterminer si une utilisation supplémentaire de l’outil est nécessaire ou si la tâche a été terminée.
- Si Claude décide qu’il a besoin d’un autre outil, il répond avec une autre
stop_reason
tool_use
et vous devez revenir à l’étape 3. - Sinon, il rédige une réponse textuelle à l’utilisateur.
Nous appelons la répétition des étapes 3 et 4 sans entrée utilisateur la “boucle d’agent” - c’est-à-dire que Claude répond avec une requête d’utilisation d’outil et que votre application répond à Claude avec les résultats de l’évaluation de cette requête.
Comment implémenter l’utilisation de l’ordinateur
Commencez par notre implémentation de référence
Nous avons créé une implémentation de référence qui comprend tout ce dont vous avez besoin pour commencer rapidement avec l’utilisation de l’ordinateur :
- Un environnement conteneurisé adapté à l’utilisation de l’ordinateur avec Claude
- Des implémentations des outils d’utilisation de l’ordinateur
- Une boucle d’agent qui interagit avec l’API Anthropic et exécute les résultats d’utilisation de l’ordinateur
- Une interface Web pour interagir avec le conteneur, la boucle d’agent et les outils.
Nous vous recommandons d’essayer l’implémentation de référence avant de lire le reste de cette documentation.
Optimisez les performances du modèle avec le prompting
Voici quelques conseils pour obtenir des résultats de meilleure qualité :
- Spécifiez des tâches simples et bien définies et fournissez des instructions explicites pour chaque étape.
- Claude suppose parfois les résultats de ses actions sans vérifier explicitement leurs résultats. Pour éviter cela, vous pouvez inciter le modèle avec
Après chaque étape, prenez une capture d'écran et évaluez attentivement si vous avez atteint le bon résultat. Montrez explicitement votre raisonnement : "J'ai évalué l'étape X..." Si ce n'est pas correct, réessayez. Ce n'est que lorsque vous confirmez qu'une étape a été exécutée correctement que vous devez passer à la suivante.
- Certains éléments d’interface utilisateur (comme les menus déroulants et les barres de défilement) peuvent être difficiles à manipuler pour Claude à l’aide de mouvements de souris. Si vous rencontrez ce problème, essayez d’inciter le modèle à utiliser des raccourcis clavier.
- Pour les tâches répétables ou les interactions avec l’interface utilisateur, incluez des exemples de captures d’écran et d’appels d’outils de résultats réussis dans votre invite.
- Si vous avez besoin que le modèle se connecte, fournissez-lui le nom d’utilisateur et le mot de passe dans votre invite à l’intérieur de balises xml comme
<robot_credentials>
. L’utilisation de l’ordinateur dans des applications nécessitant une connexion augmente le risque de mauvais résultats à cause de l’injection de prompts. Veuillez consulter notre guide sur l’atténuation des injections de prompts avant de fournir au modèle des identifiants de connexion.
Si vous rencontrez à plusieurs reprises un ensemble clair de problèmes ou si vous savez à l’avance les tâches que Claude devra accomplir, utilisez l’invite système pour fournir à Claude des conseils ou des instructions explicites sur la façon de réussir les tâches.
Invites système
Lorsque l’un des outils définis par Anthropic est demandé via l’API Anthropic, une invite système spécifique à l’utilisation de l’ordinateur est générée. Elle est similaire à l’invite système d’utilisation d’outil mais commence par :
Vous avez accès à un ensemble de fonctions que vous pouvez utiliser pour répondre à la question de l’utilisateur. Cela inclut l’accès à un environnement informatique de bac à sable. Vous n’avez PAS actuellement la possibilité d’inspecter les fichiers ou d’interagir avec des ressources externes, sauf en invoquant les fonctions ci-dessous.
Comme avec l’utilisation régulière d’outils, le champ system_prompt
fourni par l’utilisateur est toujours respecté et utilisé dans la construction de l’invite système combinée.
Comprendre les outils définis par Anthropic
Étant donné qu’il s’agit d’une version bêta, ces définitions d’outils sont sujettes à changement.
Nous avons fourni un ensemble d’outils qui permettent à Claude d’utiliser efficacement les ordinateurs. Lors de la spécification d’un outil défini par Anthropic, les champs description
et tool_schema
ne sont ni nécessaires ni autorisés.
Les outils définis par Anthropic sont exécutés par l’utilisateur
Les outils définis par Anthropic sont définis par Anthropic, mais vous devez explicitement évaluer les résultats de l’outil et renvoyer les tool_results
à Claude. Comme pour tout outil, le modèle n’exécute pas automatiquement l’outil.
Nous fournissons actuellement 3 outils définis par Anthropic :
{ "type": "computer_20241022", "name": "computer" }
{ "type": "text_editor_20241022", "name": "str_replace_editor" }
{ "type": "bash_20241022", "name": "bash" }
Le champ type
identifie l’outil et ses paramètres à des fins de validation, le champ name
est le nom de l’outil exposé au modèle.
Si vous voulez inciter le modèle à utiliser l’un de ces outils, vous pouvez faire explicitement référence à l’outil par le champ name
. Le champ name
doit être unique dans la liste des outils ; vous ne pouvez pas définir un outil avec le même nom qu’un outil défini par Anthropic dans la même appel API.
Nous ne recommandons pas de définir des outils avec les noms des outils définis par Anthropic. Bien que vous puissiez toujours redéfinir des outils avec ces noms (tant que le nom de l’outil est unique dans votre bloc tools
), cela peut entraîner une dégradation des performances du modèle.
Combiner l’utilisation de l’ordinateur avec d’autres outils
Vous pouvez combiner l’utilisation régulière d’outils avec les outils définis par Anthropic pour l’utilisation de l’ordinateur.
Construire un environnement d’utilisation de l’ordinateur personnalisé
L’implémentation de référence est destinée à vous aider à commencer avec l’utilisation de l’ordinateur. Elle comprend tous les composants nécessaires pour que Claude utilise un ordinateur. Cependant, vous pouvez construire votre propre environnement pour l’utilisation de l’ordinateur afin de répondre à vos besoins. Vous aurez besoin de :
- Un environnement virtualisé ou conteneurisé adapté à l’utilisation de l’ordinateur avec Claude
- Une implémentation d’au moins un des outils d’utilisation de l’ordinateur définis par Anthropic
- Une boucle d’agent qui interagit avec l’API Anthropic et exécute les résultats
tool_use
à l’aide de vos implémentations d’outils - Une API ou une interface utilisateur qui permet l’entrée utilisateur pour démarrer la boucle d’agent
Comprendre les limitations de l’utilisation de l’ordinateur
La fonctionnalité d’utilisation de l’ordinateur est en version bêta. Bien que les capacités de Claude soient de pointe, les développeurs doivent être conscients de ses limites :
- Latence : la latence actuelle de l’utilisation de l’ordinateur pour les interactions homme-IA peut être trop lente par rapport aux actions informatiques régulières dirigées par l’homme. Nous vous recommandons de vous concentrer sur les cas d’utilisation où la vitesse n’est pas critique (par exemple, la collecte d’informations en arrière-plan, les tests logiciels automatisés) dans des environnements de confiance.
- Précision et fiabilité de la vision par ordinateur : Claude peut commettre des erreurs ou des hallucinations lors de la sortie de coordonnées spécifiques pendant la génération d’actions.
- Précision et fiabilité de la sélection d’outils : Claude peut commettre des erreurs ou des hallucinations lors de la sélection d’outils pendant la génération d’actions ou prendre des actions inattendues pour résoudre des problèmes. De plus, la fiabilité peut être plus faible lors de l’interaction avec des applications de niche ou plusieurs applications à la fois. Nous recommandons aux utilisateurs d’inciter le modèle avec soin lorsqu’ils demandent des tâches complexes.
- Fiabilité du défilement : Le défilement peut être peu fiable dans l’expérience actuelle, et le modèle peut ne pas défiler de manière fiable jusqu’au bas de la page. Le comportement de défilement peut être amélioré via des frappes de touches (PgUp/PgDown).
- Interaction avec les feuilles de calcul : Les clics de souris pour l’interaction avec les feuilles de calcul sont peu fiables. La sélection des cellules peut ne pas toujours fonctionner comme prévu. Cela peut être atténué en incitant le modèle à utiliser les touches fléchées.
- Création de comptes et génération de contenu sur les plateformes de médias sociaux et de communication : Bien que Claude puisse visiter des sites Web, nous limitons sa capacité à créer des comptes ou à générer et partager du contenu ou à se faire passer pour un humain sur les plateformes de médias sociaux et de communication. Nous pouvons mettre à jour cette fonctionnalité à l’avenir.
- Vulnérabilités : Des vulnérabilités comme le jailbreaking ou l’injection de prompts peuvent persister dans les systèmes d’IA de pointe, y compris l’API bêta d’utilisation de l’ordinateur. Dans certaines circonstances, Claude suivra les commandes trouvées dans le contenu, parfois même en conflit avec les instructions de l’utilisateur. Par exemple, les instructions de Claude sur les pages Web ou contenues dans les images peuvent remplacer les instructions ou amener Claude à commettre des erreurs. Nous recommandons : a. Limiter l’utilisation de l’ordinateur à des environnements de confiance tels que des machines virtuelles ou des conteneurs avec des privilèges minimaux b. Éviter de donner à l’utilisation de l’ordinateur accès à des comptes ou des données sensibles sans surveillance stricte c. Informer les utilisateurs finaux des risques pertinents et obtenir leur consentement avant d’activer ou de demander les autorisations nécessaires pour les fonctionnalités d’utilisation de l’ordinateur dans vos applications
- Actions inappropriées ou illégales : Conformément aux conditions d’utilisation d’Anthropic, vous ne devez pas employer l’utilisation de l’ordinateur pour violer les lois ou notre Politique d’utilisation acceptable.
Examinez et vérifiez toujours attentivement les actions et les journaux d’utilisation de l’ordinateur de Claude. N’utilisez pas Claude pour des tâches nécessitant une précision parfaite ou des informations sensibles sur les utilisateurs sans supervision humaine.
Tarification
Consultez la documentation sur la tarification de l’utilisation d’outils pour une explication détaillée de la façon dont les requêtes de l’API d’utilisation d’outils de Claude sont facturées.
Comme sous-ensemble des requêtes d’utilisation d’outils, les requêtes d’utilisation de l’ordinateur sont facturées de la même manière que toute autre requête de l’API Claude.
Nous incluons également automatiquement une invite système spéciale pour le modèle, qui permet l’utilisation de l’ordinateur.
Modèle | Choix d’outil | Nombre de jetons de l’invite système |
---|---|---|
Claude 3.5 Sonnet (nouveau) | auto any , tool | 466 jetons 499 jetons |
En plus des jetons de base, les jetons d’entrée supplémentaires suivants sont nécessaires pour les outils définis par Anthropic :
Outil | Jetons d’entrée supplémentaires |
---|---|
computer_20241022 | 683 jetons |
text_editor_20241022 | 700 jetons |
bash_20241022 | 245 jetons |