Il modello Claude 3.5 Sonnet aggiornato è in grado di interagire con strumenti che possono manipolare un ambiente desktop del computer.

L’uso del computer è una funzionalità beta. Si prega di essere consapevoli che l’uso del computer comporta rischi unici che sono distinti dalle normali funzionalità API o dalle interfacce di chat. Questi rischi sono aumentati quando si utilizza l’uso del computer per interagire con Internet. Per ridurre al minimo i rischi, si consideri di adottare precauzioni come:

  1. Utilizzare una macchina virtuale o un container dedicato con privilegi minimi per prevenire attacchi diretti al sistema o incidenti.
  2. Evitare di dare al modello accesso a dati sensibili, come le informazioni di accesso all’account, per prevenire il furto di informazioni.
  3. Limitare l’accesso a Internet a un elenco di domini consentiti per ridurre l’esposizione a contenuti dannosi.
  4. Chiedere a un umano di confermare le decisioni che potrebbero comportare conseguenze significative nel mondo reale, nonché qualsiasi attività che richieda un consenso affermativo, come accettare i cookie, eseguire transazioni finanziarie o accettare termini di servizio.

In alcune circostanze, Claude seguirà i comandi trovati nei contenuti anche se in conflitto con le istruzioni dell’utente. Ad esempio, le istruzioni di Claude su pagine web o contenute in immagini potrebbero sovrascrivere le istruzioni o causare errori di Claude. Suggeriamo di adottare precauzioni per isolare Claude da dati e azioni sensibili per evitare rischi legati all’iniezione di prompt.

Infine, si prega di informare gli utenti finali dei rischi pertinenti e di ottenere il loro consenso prima di abilitare l’uso del computer nei propri prodotti.

Implementazione di riferimento per l'uso del computer

Inizia rapidamente con la nostra implementazione di riferimento per l’uso del computer che include un’interfaccia web, un container Docker, implementazioni di esempio degli strumenti e un ciclo di agente.

Si prega di utilizzare questo modulo per fornire feedback sulla qualità delle risposte del modello, sull’API stessa o sulla qualità della documentazione - non vediamo l’ora di ricevere vostre notizie!

Ecco un esempio di come fornire strumenti per l’uso del computer a Claude utilizzando l’API Messages:


Come funziona l’uso del computer

1. Fornisci a Claude strumenti per l'uso del computer e un prompt dell'utente

  • Aggiungi strumenti per l’uso del computer definiti da Anthropic alla tua richiesta API.
  • Includi un prompt dell’utente che potrebbe richiedere questi strumenti, ad es. “Salva un’immagine di un gatto sulla mia scrivania.”

2. Claude decide di utilizzare uno strumento

  • Claude carica le definizioni degli strumenti per l’uso del computer memorizzate e valuta se uno qualsiasi degli strumenti può essere d’aiuto per la query dell’utente.
  • In caso affermativo, Claude costruisce una richiesta di utilizzo dello strumento correttamente formattata.
  • La risposta dell’API ha un stop_reason di tool_use, segnalando l’intenzione di Claude.

3. Estrai l'input dello strumento, valuta lo strumento su un computer e restituisci i risultati

  • Dalla tua parte, estrai il nome e l’input dello strumento dalla richiesta di Claude.
  • Utilizza lo strumento su un container o una macchina virtuale.
  • Continua la conversazione con un nuovo messaggio user contenente un blocco di contenuto tool_result.

4. Claude continua a chiamare gli strumenti per l'uso del computer fino al completamento dell'attività

  • Claude analizza i risultati degli strumenti per determinare se è necessario un ulteriore utilizzo dello strumento o se l’attività è stata completata.
  • Se Claude decide di aver bisogno di un altro strumento, risponde con un altro stop_reason di tool_use e dovresti tornare al passo 3.
  • Altrimenti, elabora una risposta testuale per l’utente.

Ci riferiamo alla ripetizione dei passi 3 e 4 senza input dell’utente come “ciclo dell’agente” - cioè, Claude risponde con una richiesta di utilizzo dello strumento e la tua applicazione risponde a Claude con i risultati della valutazione di quella richiesta.


Come implementare l’uso del computer

Inizia con la nostra implementazione di riferimento

Abbiamo realizzato un’implementazione di riferimento che include tutto il necessario per iniziare rapidamente con l’uso del computer:

Consigliamo di provare l’implementazione di riferimento prima di leggere il resto di questa documentazione.

Ottimizza le prestazioni del modello con il prompting

Ecco alcuni suggerimenti su come ottenere output di qualità migliore:

  1. Specifica attività semplici e ben definite e fornisci istruzioni esplicite per ogni fase.
  2. A volte Claude presume gli esiti delle sue azioni senza verificarne esplicitamente i risultati. Per evitare questo puoi sollecitare Claude con Dopo ogni fase, fai uno screenshot e valuta attentamente se hai raggiunto il risultato corretto. Mostra esplicitamente il tuo ragionamento: "Ho valutato il passo X..." Se non è corretto, riprova. Solo quando confermi che un passo è stato eseguito correttamente dovresti passare al successivo.
  3. Alcuni elementi dell’interfaccia utente (come menu a discesa e barre di scorrimento) potrebbero essere difficili da manipolare per Claude utilizzando i movimenti del mouse. Se riscontri questo problema, prova a sollecitare il modello a utilizzare le scorciatoie da tastiera.
  4. Per attività o interazioni con l’interfaccia utente ripetibili, includi screenshot di esempio e chiamate di strumenti di esiti positivi nel tuo prompt.
  5. Se hai bisogno che il modello effettui l’accesso, forniscigli il nome utente e la password nel tuo prompt all’interno di tag xml come <robot_credentials>. L’utilizzo del computer all’interno di applicazioni che richiedono l’accesso aumenta il rischio di risultati negativi a causa dell’iniezione di prompt. Si prega di esaminare la nostra guida per mitigare le iniezioni di prompt prima di fornire al modello le credenziali di accesso.

Se incontri ripetutamente un chiaro insieme di problemi o sai in anticipo le attività che Claude dovrà completare, utilizza il prompt di sistema per fornire a Claude suggerimenti o istruzioni esplicite su come svolgere con successo le attività.

Prompt di sistema

Quando uno degli strumenti per l’uso del computer definiti da Anthropic viene richiesto tramite l’API Anthropic, viene generato un prompt di sistema specifico per l’uso del computer. È simile al prompt di sistema per l’uso degli strumenti ma inizia con:

Hai accesso a un set di funzioni che puoi utilizzare per rispondere alla domanda dell’utente. Questo include l’accesso a un ambiente di calcolo isolato. NON hai attualmente la possibilità di ispezionare file o interagire con risorse esterne, se non invocando le funzioni sottostanti.

Come per l’uso regolare degli strumenti, il campo system_prompt fornito dall’utente viene comunque rispettato e utilizzato nella costruzione del prompt di sistema combinato.

Comprendi gli strumenti definiti da Anthropic

Poiché si tratta di una beta, queste definizioni di strumenti sono soggette a modifiche.

Abbiamo fornito un set di strumenti che consentono a Claude di utilizzare efficacemente i computer. Quando si specifica uno strumento definito da Anthropic, i campi description e tool_schema non sono necessari o consentiti.

Gli strumenti definiti da Anthropic sono eseguiti dall’utente

Gli strumenti definiti da Anthropic sono definiti da Anthropic, ma devi esplicitamente valutare i risultati dello strumento e restituire i tool_results a Claude. Come per qualsiasi altro strumento, il modello non esegue automaticamente lo strumento.

Attualmente forniamo 3 strumenti definiti da Anthropic:

  • { "type": "computer_20241022", "name": "computer" }
  • { "type": "text_editor_20241022", "name": "str_replace_editor" }
  • { "type": "bash_20241022", "name": "bash" }

Il campo type identifica lo strumento e i suoi parametri per la convalida, il campo name è il nome dello strumento esposto al modello.

Se vuoi sollecitare il modello a utilizzare uno di questi strumenti, puoi fare riferimento esplicito allo strumento dal campo name. Il campo name deve essere univoco all’interno dell’elenco degli strumenti; non puoi definire uno strumento con lo stesso nome di uno strumento definito da Anthropic nella stessa chiamata API.

Non consigliamo di definire strumenti con i nomi degli strumenti definiti da Anthropic. Sebbene tu possa ridefinire gli strumenti con questi nomi (purché il nome dello strumento sia univoco nel tuo blocco tools), farlo potrebbe comportare prestazioni degradate del modello.

Combina l’uso del computer con altri strumenti

Puoi combinare l’uso regolare degli strumenti con gli strumenti definiti da Anthropic per l’uso del computer.

Costruisci un ambiente personalizzato per l’uso del computer

L’implementazione di riferimento è intesa per aiutarti a iniziare con l’uso del computer. Include tutti i componenti necessari per far utilizzare un computer a Claude. Tuttavia, puoi costruire il tuo ambiente per l’uso del computer per soddisfare le tue esigenze. Avrai bisogno di:

  • Un ambiente virtualizzato o containerizzato adatto all’uso del computer con Claude
  • Un’implementazione di almeno uno degli strumenti per l’uso del computer definiti da Anthropic
  • Un ciclo di agente che interagisce con l’API Anthropic ed esegue i risultati di tool_use utilizzando le tue implementazioni degli strumenti
  • Un’API o un’interfaccia utente che consenta l’input dell’utente per avviare il ciclo dell’agente

Comprendi i limiti dell’uso del computer

La funzionalità di utilizzo del computer è in beta. Sebbene le capacità di Claude siano all’avanguardia, gli sviluppatori dovrebbero essere consapevoli dei suoi limiti:

  1. Latenza: l’attuale latenza dell’uso del computer per le interazioni uomo-AI potrebbe essere troppo lenta rispetto alle normali azioni dirette dal computer umano. Consigliamo di concentrarsi sui casi d’uso in cui la velocità non è critica (ad es. raccolta di informazioni di background, test automatizzati del software) in ambienti affidabili.
  2. Precisione e affidabilità della visione artificiale: Claude potrebbe commettere errori o allucinare quando genera coordinate specifiche durante la generazione di azioni.
  3. Precisione e affidabilità della selezione degli strumenti: Claude potrebbe commettere errori o allucinare quando seleziona strumenti durante la generazione di azioni o intraprendere azioni impreviste per risolvere problemi. Inoltre, l’affidabilità potrebbe essere inferiore quando si interagisce con applicazioni di nicchia o più applicazioni contemporaneamente. Consigliamo agli utenti di sollecitare attentamente il modello quando richiedono attività complesse.
  4. Affidabilità dello scorrimento: Lo scorrimento potrebbe non essere affidabile nell’esperienza attuale e il modello potrebbe non scorrere in modo affidabile fino al fondo di una pagina. Il comportamento simile allo scorrimento può essere migliorato tramite tasti di scelta rapida (PgUp/PgDown).
  5. Interazione con i fogli di calcolo: I clic del mouse per l’interazione con i fogli di calcolo non sono affidabili. La selezione delle celle potrebbe non funzionare sempre come previsto. Questo può essere mitigato sollecitando il modello a utilizzare i tasti di scelta rapida.
  6. Creazione di account e generazione di contenuti su piattaforme di social media e comunicazione: Sebbene Claude visiterà i siti web, stiamo limitando la sua capacità di creare account o generare e condividere contenuti o impersonare esseri umani sui siti web e sulle piattaforme di social media. Potremmo aggiornare questa funzionalità in futuro.
  7. Vulnerabilità: Vulnerabilità come il jailbreaking o l’iniezione di prompt potrebbero persistere nei sistemi AI all’avanguardia, inclusa l’API beta per l’uso del computer. In alcune circostanze, Claude seguirà i comandi trovati nei contenuti, a volte anche in conflitto con le istruzioni dell’utente. Ad esempio, le istruzioni di Claude su pagine web o contenute in immagini potrebbero sovrascrivere le istruzioni o causare errori di Claude. Consigliamo: a. Limitare l’uso del computer ad ambienti affidabili come macchine virtuali o container con privilegi minimi b. Evitare di dare all’uso del computer accesso ad account o dati sensibili senza una stretta supervisione c. Informare gli utenti finali dei rischi pertinenti e ottenere il loro consenso prima di abilitare o richiedere le autorizzazioni necessarie per le funzionalità di utilizzo del computer nelle tue applicazioni
  8. Azioni inappropriate o illegali: Secondo i termini di servizio di Anthropic, non devi utilizzare l’uso del computer per violare alcuna legge o la nostra Politica di utilizzo accettabile.

Rivedi e verifica sempre attentamente le azioni e i log dell’uso del computer di Claude. Non utilizzare Claude per attività che richiedono precisione perfetta o informazioni sensibili degli utenti senza supervisione umana.


Prezzi

Consulta la documentazione sui prezzi dell’uso degli strumenti per una spiegazione dettagliata su come vengono addebitate le richieste dell’API Claude Tool Use.

Poiché le richieste di utilizzo del computer sono un sottoinsieme delle richieste di utilizzo degli strumenti, vengono addebitate allo stesso modo di qualsiasi altra richiesta dell’API Claude.

Includiamo automaticamente anche un prompt di sistema speciale per il modello, che abilita l’uso del computer.

ModelloScelta dello strumentoConteggio token del prompt di sistema
Claude 3.5 Sonnet (nuovo)auto
any, tool
466 token
499 token

Oltre ai token di base, sono necessari i seguenti token di input aggiuntivi per gli strumenti definiti da Anthropic:

StrumentoToken di input aggiuntivi
computer_20241022683 token
text_editor_20241022700 token
bash_20241022245 token