Utilizzo del computer (beta)

Claude 4 Opus e Sonnet, insieme a Claude Sonnet 3.7 e Claude Sonnet 3.5 (nuovo), sono in grado di interagire con strumenti che possono manipolare un ambiente desktop del computer. I modelli Claude 4 utilizzano versioni aggiornate degli strumenti ottimizzate per la nuova architettura. Claude Sonnet 3.7 introduce strumenti aggiuntivi e consente di abilitare il pensiero, fornendoti maggiori informazioni sul processo di ragionamento del modello.

L’utilizzo del computer è una funzionalità beta. Si prega di essere consapevoli che l’utilizzo del computer comporta rischi unici che sono distinti dalle funzionalità API standard o dalle interfacce di chat. Questi rischi sono maggiori quando si utilizza il computer per interagire con Internet. Per ridurre al minimo i rischi, considera di prendere precauzioni come:

Utilizzare una macchina virtuale dedicata o un container con privilegi minimi per prevenire attacchi diretti al sistema o incidenti.
Evitare di dare al modello accesso a dati sensibili, come informazioni di accesso all’account, per prevenire il furto di informazioni.
Limitare l’accesso a Internet a una lista consentita di domini per ridurre l’esposizione a contenuti dannosi.
Chiedere a un essere umano di confermare decisioni che potrebbero comportare conseguenze significative nel mondo reale, nonché qualsiasi attività che richieda un consenso affermativo, come accettare i cookie, eseguire transazioni finanziarie o accettare termini di servizio.

In alcune circostanze, Claude seguirà i comandi trovati nei contenuti anche se sono in conflitto con le istruzioni dell’utente. Ad esempio, le istruzioni di Claude sulle pagine web o contenute nelle immagini potrebbero sovrascrivere le istruzioni o causare errori a Claude. Suggeriamo di prendere precauzioni per isolare Claude da dati e azioni sensibili per evitare rischi legati all’iniezione di prompt.

Abbiamo addestrato il modello a resistere a queste iniezioni di prompt e abbiamo aggiunto un ulteriore livello di difesa. Se utilizzi i nostri strumenti di utilizzo del computer, eseguiremo automaticamente classificatori sui tuoi prompt per segnalare potenziali casi di iniezioni di prompt. Quando questi classificatori identificano potenziali iniezioni di prompt negli screenshot, indirizzeranno automaticamente il modello a chiedere la conferma dell’utente prima di procedere con l’azione successiva. Riconosciamo che questa protezione aggiuntiva potrebbe non essere ideale per ogni caso d’uso (ad esempio, casi d’uso senza un essere umano nel ciclo), quindi se desideri disattivarla, contattaci.

Suggeriamo comunque di prendere precauzioni per isolare Claude da dati e azioni sensibili per evitare rischi legati all’iniezione di prompt.

Infine, si prega di informare gli utenti finali dei rischi pertinenti e ottenere il loro consenso prima di abilitare l’utilizzo del computer nei propri prodotti.

Implementazione di riferimento per l'utilizzo del computer

Inizia rapidamente con la nostra implementazione di riferimento per l’utilizzo del computer che include un’interfaccia web, un container Docker, implementazioni di strumenti di esempio e un ciclo di agente.

Nota: L’implementazione è stata aggiornata per includere nuovi strumenti sia per Claude 4 che per Claude Sonnet 3.7. Assicurati di scaricare l’ultima versione del repository per accedere a queste nuove funzionalità.

Utilizza questo modulo per fornire feedback sulla qualità delle risposte del modello, sull’API stessa o sulla qualità della documentazione - non vediamo l’ora di ricevere il tuo feedback!

Ecco un esempio di come fornire strumenti di utilizzo del computer a Claude utilizzando l’API Messages:

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: computer-use-2025-01-24" \
  -d '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 1024,
    "tools": [
      {
        "type": "computer_20250124",
        "name": "computer",
        "display_width_px": 1024,
        "display_height_px": 768,
        "display_number": 1
      },
      {
        "type": "text_editor_20250429",
        "name": "str_replace_based_edit_tool"
      },
      {
        "type": "bash_20250124",
        "name": "bash"
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Save a picture of a cat to my desktop."
      }
    ],
    "thinking": {
      "type": "enabled",
      "budget_tokens": 1024
    }
  }'

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: computer-use-2025-01-24" \
  -d '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 1024,
    "tools": [
      {
        "type": "computer_20250124",
        "name": "computer",
        "display_width_px": 1024,
        "display_height_px": 768,
        "display_number": 1
      },
      {
        "type": "text_editor_20250429",
        "name": "str_replace_based_edit_tool"
      },
      {
        "type": "bash_20250124",
        "name": "bash"
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Save a picture of a cat to my desktop."
      }
    ],
    "thinking": {
      "type": "enabled",
      "budget_tokens": 1024
    }
  }'

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: computer-use-2025-01-24" \
  -d '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "tools": [
      {
        "type": "computer_20250124",
        "name": "computer",
        "display_width_px": 1024,
        "display_height_px": 768,
        "display_number": 1
      },
      {
        "type": "text_editor_20250124",
        "name": "str_replace_editor"
      },
      {
        "type": "bash_20250124",
        "name": "bash"
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Save a picture of a cat to my desktop."
      }
    ],
    "thinking": {
      "type": "enabled",
      "budget_tokens": 1024
    }
  }'

Come funziona l’utilizzo del computer

1. Fornisci a Claude gli strumenti di utilizzo del computer e un prompt utente

Aggiungi strumenti di utilizzo del computer definiti da Anthropic alla tua richiesta API.
Includi un prompt utente che potrebbe richiedere questi strumenti, ad esempio “Salva un’immagine di un gatto sul mio desktop.”

2. Claude decide di utilizzare uno strumento

Claude carica le definizioni degli strumenti di utilizzo del computer memorizzate e valuta se qualche strumento può aiutare con la query dell’utente.
In caso affermativo, Claude costruisce una richiesta di utilizzo dello strumento correttamente formattata.
La risposta API ha un stop_reason di tool_use, segnalando l’intenzione di Claude.

3. Estrai l'input dello strumento, valuta lo strumento su un computer e restituisci i risultati

Dal tuo lato, estrai il nome dello strumento e l’input dalla richiesta di Claude.
Utilizza lo strumento su un container o una Macchina Virtuale.
Continua la conversazione con un nuovo messaggio user contenente un blocco di contenuto tool_result.

4. Claude continua a chiamare gli strumenti di utilizzo del computer fino al completamento dell'attività

Claude analizza i risultati dello strumento per determinare se è necessario un ulteriore utilizzo dello strumento o se l’attività è stata completata.
Se Claude decide che ha bisogno di un altro strumento, risponde con un altro stop_reason di tool_use e dovresti tornare al passaggio 3.
Altrimenti, elabora una risposta testuale per l’utente.

Ci riferiamo alla ripetizione dei passaggi 3 e 4 senza input dell’utente come “ciclo dell’agente” - cioè, Claude che risponde con una richiesta di utilizzo dello strumento e la tua applicazione che risponde a Claude con i risultati della valutazione di quella richiesta.

L’ambiente di calcolo

L’utilizzo del computer richiede un ambiente di calcolo isolato in cui Claude può interagire in modo sicuro con le applicazioni e il web. Questo ambiente include:

Display virtuale: Un server di display X11 virtuale (utilizzando Xvfb) che renderizza l’interfaccia desktop che Claude vedrà attraverso screenshot e controllerà con azioni del mouse/tastiera.
Ambiente desktop: Un’interfaccia utente leggera con gestore di finestre (Mutter) e pannello (Tint2) in esecuzione su Linux, che fornisce un’interfaccia grafica coerente con cui Claude può interagire.
Applicazioni: Applicazioni Linux preinstallate come Firefox, LibreOffice, editor di testo e gestori di file che Claude può utilizzare per completare le attività.
Implementazioni degli strumenti: Codice di integrazione che traduce le richieste di strumenti astratti di Claude (come “sposta il mouse” o “fai uno screenshot”) in operazioni effettive nell’ambiente virtuale.
Ciclo dell’agente: Un programma che gestisce la comunicazione tra Claude e l’ambiente, inviando le azioni di Claude all’ambiente e restituendo i risultati (screenshot, output dei comandi) a Claude.

Quando utilizzi l’utilizzo del computer, Claude non si connette direttamente a questo ambiente. Invece, la tua applicazione:

Riceve le richieste di utilizzo degli strumenti di Claude
Le traduce in azioni nel tuo ambiente di calcolo
Cattura i risultati (screenshot, output dei comandi, ecc.)
Restituisce questi risultati a Claude

Per sicurezza e isolamento, l’implementazione di riferimento esegue tutto questo all’interno di un container Docker con mappature di porte appropriate per visualizzare e interagire con l’ambiente.

Come implementare l’utilizzo del computer

Inizia con la nostra implementazione di riferimento

Abbiamo costruito un’implementazione di riferimento che include tutto ciò di cui hai bisogno per iniziare rapidamente con l’utilizzo del computer:

Un ambiente containerizzato adatto per l’utilizzo del computer con Claude
Implementazioni degli strumenti di utilizzo del computer
Un ciclo dell’agente che interagisce con l’API Anthropic ed esegue gli strumenti di utilizzo del computer
Un’interfaccia web per interagire con il container, il ciclo dell’agente e gli strumenti.

Comprendere il ciclo multi-agente

Il nucleo dell’utilizzo del computer è il “ciclo dell’agente” - un ciclo in cui Claude richiede azioni degli strumenti, la tua applicazione le esegue e restituisce i risultati a Claude. Ecco un esempio semplificato:

async def sampling_loop(
    *,
    model: str,
    messages: list[dict],
    api_key: str,
    max_tokens: int = 4096,
    tool_version: str,
    thinking_budget: int | None = None,
    max_iterations: int = 10,  # Aggiungi limite di iterazioni per prevenire cicli infiniti
):
    """
    Un semplice ciclo dell'agente per le interazioni di utilizzo del computer di Claude.

    Questa funzione gestisce il botta e risposta tra:
    1. Invio di messaggi utente a Claude
    2. Claude che richiede di utilizzare strumenti
    3. La tua app che esegue quegli strumenti
    4. Invio dei risultati degli strumenti a Claude
    """
    # Configura strumenti e parametri API
    client = Anthropic(api_key=api_key)
    beta_flag = "computer-use-2025-01-24" if "20250124" in tool_version else "computer-use-2024-10-22"

    # Configura strumenti - dovresti averli già inizializzati altrove
    tools = [
        {"type": f"computer_{tool_version}", "name": "computer", "display_width_px": 1024, "display_height_px": 768},
        {"type": f"text_editor_{tool_version}", "name": "str_replace_editor"},
        {"type": f"bash_{tool_version}", "name": "bash"}
    ]

    # Ciclo dell'agente principale (con limite di iterazioni per prevenire costi API incontrollati)
    iterations = 0
    while True and iterations < max_iterations:
        iterations += 1
        # Configura parametro di pensiero opzionale (per Claude Sonnet 3.7)
        thinking = None
        if thinking_budget:
            thinking = {"type": "enabled", "budget_tokens": thinking_budget}

        # Chiama l'API Claude
        response = client.beta.messages.create(
            model=model,
            max_tokens=max_tokens,
            messages=messages,
            tools=tools,
            betas=[beta_flag],
            thinking=thinking
        )

        # Aggiungi la risposta di Claude alla cronologia della conversazione
        response_content = response.content
        messages.append({"role": "assistant", "content": response_content})

        # Controlla se Claude ha utilizzato strumenti
        tool_results = []
        for block in response_content:
            if block.type == "tool_use":
                # In un'app reale, eseguiresti lo strumento qui
                # Ad esempio: result = run_tool(block.name, block.input)
                result = {"result": "Strumento eseguito con successo"}

                # Formatta il risultato per Claude
                tool_results.append({
                    "type": "tool_result",
                    "tool_use_id": block.id,
                    "content": result
                })

        # Se non sono stati utilizzati strumenti, Claude ha finito - restituisci i messaggi finali
        if not tool_results:
            return messages

        # Aggiungi i risultati degli strumenti ai messaggi per la prossima iterazione con Claude
        messages.append({"role": "user", "content": tool_results})

Il ciclo continua fino a quando Claude risponde senza richiedere alcuno strumento (completamento dell’attività) o viene raggiunto il limite massimo di iterazioni. Questa salvaguardia previene potenziali cicli infiniti che potrebbero comportare costi API imprevisti.

Per ogni versione degli strumenti, devi utilizzare il flag beta corrispondente nella tua richiesta API:

Flag beta di Claude 4

Flag beta di Claude Sonnet 3.7

Flag beta di Claude Sonnet 3.5 (nuovo)

Ti consigliamo di provare l’implementazione di riferimento prima di leggere il resto di questa documentazione.

Ottimizza le prestazioni del modello con il prompting

Ecco alcuni suggerimenti su come ottenere output di migliore qualità:

Specifica attività semplici e ben definite e fornisci istruzioni esplicite per ogni passaggio.
A volte Claude presuppone i risultati delle sue azioni senza verificarli esplicitamente. Per evitare questo, puoi sollecitare Claude con Dopo ogni passaggio, fai uno screenshot e valuta attentamente se hai ottenuto il risultato corretto. Mostra esplicitamente il tuo ragionamento: "Ho valutato il passaggio X..." Se non è corretto, riprova. Solo quando confermi che un passaggio è stato eseguito correttamente dovresti passare al successivo.
Alcuni elementi dell’interfaccia utente (come menu a discesa e barre di scorrimento) potrebbero essere difficili da manipolare per Claude utilizzando i movimenti del mouse. Se riscontri questo problema, prova a sollecitare il modello a utilizzare scorciatoie da tastiera.
Per attività ripetibili o interazioni con l’interfaccia utente, includi screenshot di esempio e chiamate di strumenti di risultati positivi nel tuo prompt.
Se hai bisogno che il modello effettui l’accesso, forniscigli il nome utente e la password nel tuo prompt all’interno di tag xml come <robot_credentials>. L’utilizzo del computer all’interno di applicazioni che richiedono l’accesso aumenta il rischio di risultati negativi a causa dell’iniezione di prompt. Si prega di consultare la nostra guida sulla mitigazione delle iniezioni di prompt prima di fornire al modello le credenziali di accesso.

Se incontri ripetutamente un insieme chiaro di problemi o conosci in anticipo le attività che Claude dovrà completare, utilizza il prompt di sistema per fornire a Claude suggerimenti o istruzioni esplicite su come svolgere le attività con successo.

Prompt di sistema

Quando uno degli strumenti definiti da Anthropic viene richiesto tramite l’API Anthropic, viene generato un prompt di sistema specifico per l’utilizzo del computer. È simile al prompt di sistema per l’utilizzo degli strumenti ma inizia con:

Hai accesso a un insieme di funzioni che puoi utilizzare per rispondere alla domanda dell’utente. Questo include l’accesso a un ambiente di calcolo isolato. Attualmente NON hai la capacità di ispezionare file o interagire con risorse esterne, se non invocando le funzioni sottostanti.

Come per il normale utilizzo degli strumenti, il campo system_prompt fornito dall’utente viene comunque rispettato e utilizzato nella costruzione del prompt di sistema combinato.

Comprendere gli strumenti definiti da Anthropic

Essendo in beta, queste definizioni di strumenti sono soggette a modifiche.

Abbiamo fornito un insieme di strumenti che consentono a Claude di utilizzare efficacemente i computer. Quando si specifica uno strumento definito da Anthropic, i campi description e tool_schema non sono necessari né consentiti.

Gli strumenti definiti da Anthropic sono eseguiti dall’utente

Gli strumenti definiti da Anthropic sono definiti da Anthropic, ma devi valutare esplicitamente i risultati dello strumento e restituire i tool_results a Claude. Come per qualsiasi strumento, il modello non esegue automaticamente lo strumento.

Forniamo un insieme di strumenti definiti da Anthropic, con ogni strumento che ha versioni ottimizzate per Claude 4, Claude Sonnet 3.7 e Claude Sonnet 3.5:

Strumenti Claude 4

Strumenti Claude Sonnet 3.7

Strumenti Claude Sonnet 3.5 (nuovo)

Il campo type identifica lo strumento e i suoi parametri per scopi di convalida, il campo name è il nome dello strumento esposto al modello.

Se vuoi sollecitare il modello a utilizzare uno di questi strumenti, puoi fare riferimento esplicito allo strumento tramite il campo name. Il campo name deve essere unico all’interno dell’elenco degli strumenti; non puoi definire uno strumento con lo stesso nome di uno strumento definito da Anthropic nella stessa chiamata API.

Non consigliamo di definire strumenti con i nomi degli strumenti definiti da Anthropic. Sebbene sia ancora possibile ridefinire strumenti con questi nomi (purché il nome dello strumento sia unico nel tuo blocco tools), farlo potrebbe comportare un peggioramento delle prestazioni del modello.

Strumento computer

Non consigliamo di inviare screenshot con risoluzioni superiori a XGA/WXGA per evitare problemi relativi al ridimensionamento delle immagini. Affidarsi al comportamento di ridimensionamento delle immagini nell’API comporterà una minore precisione del modello e prestazioni più lente rispetto all’implementazione diretta del ridimensionamento.

Il repository di riferimento dimostra come ridimensionare da risoluzioni più elevate a una risoluzione consigliata.

Tipi

computer_20250124 - Strumento computer migliorato con funzionalità avanzate per Claude 4
computer_20250124 - Strumento computer migliorato con azioni aggiuntive disponibili in Claude Sonnet 3.7
computer_20241022 - Strumento computer originale utilizzato con Claude Sonnet 3.5 (nuovo)

Parametri

display_width_px: Obbligatorio La larghezza del display controllato dal modello in pixel.
display_height_px: Obbligatorio L’altezza del display controllato dal modello in pixel.
display_number: Opzionale Il numero del display da controllare (rilevante solo per ambienti X11). Se specificato, allo strumento verrà fornito un numero di display nella definizione dello strumento.

Descrizione dello strumento

Stiamo fornendo la nostra descrizione dello strumento solo come riferimento. Non dovresti specificarla nella tua chiamata di strumento definito da Anthropic.

Use a mouse and keyboard to interact with a computer, and take screenshots.
* This is an interface to a desktop GUI. You do not have access to a terminal or applications menu. You must click on desktop icons to start applications.
* Some applications may take time to start or process actions, so you may need to wait and take successive screenshots to see the results of your actions. E.g. if you click on Firefox and a window doesn't open, try taking another screenshot.
* The screen's resolution is {{ display_width_px }}x{{ display_height_px }}.
* The display number is {{ display_number }}
* Whenever you intend to move the cursor to click on an element like an icon, you should consult a screenshot to determine the coordinates of the element before moving the cursor.
* If you tried clicking on a program or link but it failed to load, even after waiting, try adjusting your cursor position so that the tip of the cursor visually falls on the element that you want to click.
* Make sure to click any buttons, links, icons, etc with the cursor tip in the center of the element. Don't click boxes on their edges unless asked.

Schema di input dello strumento

Stiamo fornendo il nostro schema di input solo come riferimento. Per lo strumento migliorato computer_20250124 disponibile con Claude Sonnet 3.7. Ecco lo schema di input completo:

{
    "properties": {
        "action": {
            "description": "The action to perform. The available actions are:\n"
            "* `key`: Press a key or key-combination on the keyboard.\n"
            "  - This supports xdotool's `key` syntax.\n"
            '  - Examples: "a", "Return", "alt+Tab", "ctrl+s", "Up", "KP_0" (for the numpad 0 key).\n'
            "* `hold_key`: Hold down a key or multiple keys for a specified duration (in seconds). Supports the same syntax as `key`.\n"
            "* `type`: Type a string of text on the keyboard.\n"
            "* `cursor_position`: Get the current (x, y) pixel coordinate of the cursor on the screen.\n"
            "* `mouse_move`: Move the cursor to a specified (x, y) pixel coordinate on the screen.\n"
            "* `left_mouse_down`: Press the left mouse button.\n"
            "* `left_mouse_up`: Release the left mouse button.\n"
            "* `left_click`: Click the left mouse button at the specified (x, y) pixel coordinate on the screen. You can also include a key combination to hold down while clicking using the `text` parameter.\n"
            "* `left_click_drag`: Click and drag the cursor from `start_coordinate` to a specified (x, y) pixel coordinate on the screen.\n"
            "* `right_click`: Click the right mouse button at the specified (x, y) pixel coordinate on the screen.\n"
            "* `middle_click`: Click the middle mouse button at the specified (x, y) pixel coordinate on the screen.\n"
            "* `double_click`: Double-click the left mouse button at the specified (x, y) pixel coordinate on the screen.\n"
            "* `triple_click`: Triple-click the left mouse button at the specified (x, y) pixel coordinate on the screen.\n"
            "* `scroll`: Scroll the screen in a specified direction by a specified amount of clicks of the scroll wheel, at the specified (x, y) pixel coordinate. DO NOT use PageUp/PageDown to scroll.\n"
            "* `wait`: Wait for a specified duration (in seconds).\n"
            "* `screenshot`: Take a screenshot of the screen.",
            "enum": [
                "key",
                "hold_key",
                "type",
                "cursor_position",
                "mouse_move",
                "left_mouse_down",
                "left_mouse_up",
                "left_click",
                "left_click_drag",
                "right_click",
                "middle_click",
                "double_click",
                "triple_click",
                "scroll",
                "wait",
                "screenshot",
            ],
            "type": "string",
        },
        "coordinate": {
            "description": "(x, y): The x (pixels from the left edge) and y (pixels from the top edge) coordinates to move the mouse to. Required only by `action=mouse_move` and `action=left_click_drag`.",
            "type": "array",
        },
        "duration": {
            "description": "The duration to hold the key down for. Required only by `action=hold_key` and `action=wait`.",
            "type": "integer",
        },
        "scroll_amount": {
            "description": "The number of 'clicks' to scroll. Required only by `action=scroll`.",
            "type": "integer",
        },
        "scroll_direction": {
            "description": "The direction to scroll the screen. Required only by `action=scroll`.",
            "enum": ["up", "down", "left", "right"],
            "type": "string",
        },
        "start_coordinate": {
            "description": "(x, y): The x (pixels from the left edge) and y (pixels from the top edge) coordinates to start the drag from. Required only by `action=left_click_drag`.",
            "type": "array",
        },
        "text": {
            "description": "Required only by `action=type`, `action=key`, and `action=hold_key`. Can also be used by click or scroll actions to hold down keys while clicking or scrolling.",
            "type": "string",
        },
    },
    "required": ["action"],
    "type": "object",
}

Per lo strumento originale computer_20241022 utilizzato con Claude Sonnet 3.5 (nuovo):

{
    "properties": {
        "action": {
            "description": """The action to perform. The available actions are:
                * `key`: Press a key or key-combination on the keyboard.
                  - This supports xdotool's `key` syntax.
                  - Examples: "a", "Return", "alt+Tab", "ctrl+s", "Up", "KP_0" (for the numpad 0 key).
                * `type`: Type a string of text on the keyboard.
                * `cursor_position`: Get the current (x, y) pixel coordinate of the cursor on the screen.
                * `mouse_move`: Move the cursor to a specified (x, y) pixel coordinate on the screen.
                * `left_click`: Click the left mouse button.
                * `left_click_drag`: Click and drag the cursor to a specified (x, y) pixel coordinate on the screen.
                * `right_click`: Click the right mouse button.
                * `middle_click`: Click the middle mouse button.
                * `double_click`: Double-click the left mouse button.
                * `screenshot`: Take a screenshot of the screen.""",
            "enum": [
                "key",
                "type",
                "mouse_move",
                "left_click",
                "left_click_drag",
                "right_click",
                "middle_click",
                "double_click",
                "screenshot",
                "cursor_position",
            ],
            "type": "string",
        },
        "coordinate": {
            "description": "(x, y): The x (pixels from the left edge) and y (pixels from the top edge) coordinates to move the mouse to. Required only by `action=mouse_move` and `action=left_click_drag`.",
            "type": "array",
        },
        "text": {
            "description": "Required only by `action=type` and `action=key`.",
            "type": "string",
        },
    },
    "required": ["action"],
    "type": "object",
}

Strumento editor di testo

Tipi

text_editor_20250429 - Editor di testo aggiornato per Claude 4 senza il comando undo_edit
text_editor_20250124 - Stesse capacità della versione 20241022, per l’uso con Claude Sonnet 3.7
text_editor_20241022 - Strumento editor di testo originale utilizzato con Claude Sonnet 3.5 (nuovo)

Descrizione dello strumento

Stiamo fornendo la nostra descrizione dello strumento solo come riferimento. Non dovresti specificarla nella tua chiamata di strumento definito da Anthropic.

Custom editing tool for viewing, creating and editing files
* State is persistent across command calls and discussions with the user
* If `path` is a file, `view` displays the result of applying `cat -n`. If `path` is a directory, `view` lists non-hidden files and directories up to 2 levels deep
* The `create` command cannot be used if the specified `path` already exists as a file
* If a `command` generates a long output, it will be truncated and marked with `<response clipped>`
* The `undo_edit` command will revert the last edit made to the file at `path` (not available in text_editor_20250429)

Notes for using the `str_replace` command:
* The `old_str` parameter should match EXACTLY one or more consecutive lines from the original file. Be mindful of whitespaces!
* If the `old_str` parameter is not unique in the file, the replacement will not be performed. Make sure to include enough context in `old_str` to make it unique
* The `new_str` parameter should contain the edited lines that should replace the `old_str`

Schema di input dello strumento

Stiamo fornendo il nostro schema di input solo come riferimento. Non dovresti specificarlo nella tua chiamata di strumento definito da Anthropic.

{
    "properties": {
        "command": {
            "description": "The commands to run. Allowed options are: `view`, `create`, `str_replace`, `insert`, `undo_edit`.",
            "enum": ["view", "create", "str_replace", "insert", "undo_edit"],
            "type": "string",
        },
        "file_text": {
            "description": "Required parameter of `create` command, with the content of the file to be created.",
            "type": "string",
        },
        "insert_line": {
            "description": "Required parameter of `insert` command. The `new_str` will be inserted AFTER the line `insert_line` of `path`.",
            "type": "integer",
        },
        "new_str": {
            "description": "Optional parameter of `str_replace` command containing the new string (if not given, no string will be added). Required parameter of `insert` command containing the string to insert.",
            "type": "string",
        },
        "old_str": {
            "description": "Required parameter of `str_replace` command containing the string in `path` to replace.",
            "type": "string",
        },
        "path": {
            "description": "Absolute path to file or directory, e.g. `/repo/file.py` or `/repo`.",
            "type": "string",
        },
        "view_range": {
            "description": "Optional parameter of `view` command when `path` points to a file. If none is given, the full file is shown. If provided, the file will be shown in the indicated line number range, e.g. [11, 12] will show lines 11 and 12. Indexing at 1 to start. Setting `[start_line, -1]` shows all lines from `start_line` to the end of the file.",
            "items": {"type": "integer"},
            "type": "array",
        },
    },
    "required": ["command", "path"],
    "type": "object",
}

Strumento bash

Tipi

bash_20250124 - Strumento bash migliorato per Claude 4 con capacità avanzate
bash_20250124 - Stesse capacità della versione 20241022, per l’uso con Claude Sonnet 3.7
bash_20241022 - Strumento bash originale utilizzato con Claude Sonnet 3.5 (nuovo)

Descrizione dello strumento

Stiamo fornendo la nostra descrizione dello strumento solo come riferimento. Non dovresti specificarla nella tua chiamata di strumento definito da Anthropic.

Run commands in a bash shell
* When invoking this tool, the contents of the "command" parameter does NOT need to be XML-escaped.
* You have access to a mirror of common linux and python packages via apt and pip.
* State is persistent across command calls and discussions with the user.
* To inspect a particular line range of a file, e.g. lines 10-25, try 'sed -n 10,25p /path/to/the/file'.
* Please avoid commands that may produce a very large amount of output.
* Please run long lived commands in the background, e.g. 'sleep 10 &' or start a server in the background.

Schema di input dello strumento

Stiamo fornendo il nostro schema di input solo come riferimento. Non dovresti specificarlo nella tua chiamata di strumento definito da Anthropic.

{
    "properties": {
        "command": {
            "description": "The bash command to run. Required unless the tool is being restarted.",
            "type": "string",
        },
        "restart": {
            "description": "Specifying true will restart this tool. Otherwise, leave this unspecified.",
            "type": "boolean",
        },
    }
}

Abilita la capacità di pensiero in Claude 4 e Claude Sonnet 3.7

Claude Sonnet 3.7 ha introdotto una nuova capacità di “pensiero” che ti permette di vedere il processo di ragionamento del modello mentre affronta compiti complessi. Questa funzionalità ti aiuta a capire come Claude sta affrontando un problema e può essere particolarmente preziosa per il debug o per scopi educativi.

Per abilitare il pensiero, aggiungi un parametro thinking alla tua richiesta API:

"thinking": {
  "type": "enabled",
  "budget_tokens": 1024
}

Il parametro budget_tokens specifica quanti token Claude può utilizzare per il pensiero. Questo viene sottratto dal tuo budget complessivo di max_tokens.

Quando il pensiero è abilitato, Claude restituirà il suo processo di ragionamento come parte della risposta, che può aiutarti a:

Comprendere il processo decisionale del modello
Identificare potenziali problemi o incomprensioni
Imparare dall’approccio di Claude alla risoluzione dei problemi
Ottenere maggiore visibilità su operazioni complesse multi-step

Ecco un esempio di come potrebbe apparire l’output del pensiero:

[Thinking]
Devo salvare un'immagine di un gatto sul desktop. Suddividiamo questo in passaggi:

1. Prima, farò uno screenshot per vedere cosa c'è sul desktop
2. Poi cercherò un browser web per cercare immagini di gatti
3. Dopo aver trovato un'immagine adatta, dovrò salvarla sul desktop

Iniziamo facendo uno screenshot per vedere cosa è disponibile...

Combina l’utilizzo del computer con altri strumenti

Puoi combinare l’utilizzo regolare degli strumenti con gli strumenti definiti da Anthropic per l’utilizzo del computer.

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: computer-use-2025-01-24" \
  -d '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 1024,
    "tools": [
      {
        "type": "computer_20250124",
        "name": "computer",
        "display_width_px": 1024,
        "display_height_px": 768,
        "display_number": 1
      },
      {
        "type": "text_editor_20250124",
        "name": "str_replace_editor"
      },
      {
        "type": "bash_20250124",
        "name": "bash"
      },
      {
        "name": "get_weather",
        "description": "Get the current weather in a given location",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "The city and state, e.g. San Francisco, CA"
            },
            "unit": {
              "type": "string",
              "enum": ["celsius", "fahrenheit"],
              "description": "The unit of temperature, either 'celsius' or 'fahrenheit'"
            }
          },
          "required": ["location"]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Find flights from San Francisco to a place with warmer weather."
      }
    ],
    "thinking": {
      "type": "enabled",
      "budget_tokens": 1024
    }
  }'

Costruisci un ambiente personalizzato per l’utilizzo del computer

L’implementazione di riferimento è pensata per aiutarti a iniziare con l’utilizzo del computer. Include tutti i componenti necessari per far utilizzare un computer a Claude. Tuttavia, puoi costruire il tuo ambiente per l’utilizzo del computer in base alle tue esigenze. Avrai bisogno di:

Un ambiente virtualizzato o containerizzato adatto per l’utilizzo del computer con Claude
Un’implementazione di almeno uno degli strumenti di utilizzo del computer definiti da Anthropic
Un ciclo dell’agente che interagisce con l’API Anthropic ed esegue i risultati di tool_use utilizzando le tue implementazioni degli strumenti
Un’API o un’interfaccia utente che consenta l’input dell’utente per avviare il ciclo dell’agente

Comprendere i limiti dell’utilizzo del computer

La funzionalità di utilizzo del computer è in beta. Mentre le capacità di Claude sono all’avanguardia, gli sviluppatori dovrebbero essere consapevoli dei suoi limiti:

Latenza: l’attuale latenza di utilizzo del computer per le interazioni uomo-IA potrebbe essere troppo lenta rispetto alle normali azioni del computer dirette dall’uomo. Consigliamo di concentrarsi su casi d’uso in cui la velocità non è critica (ad esempio, raccolta di informazioni in background, test automatizzati di software) in ambienti fidati.
Precisione e affidabilità della visione artificiale: Claude potrebbe commettere errori o allucinare quando genera coordinate specifiche durante la generazione di azioni. Claude Sonnet 3.7 introduce la capacità di pensiero che può aiutarti a comprendere il ragionamento del modello e identificare potenziali problemi.
Precisione e affidabilità nella selezione degli strumenti: Claude potrebbe commettere errori o allucinare quando seleziona strumenti durante la generazione di azioni o intraprendere azioni inaspettate per risolvere problemi. Inoltre, l’affidabilità potrebbe essere inferiore quando interagisce con applicazioni di nicchia o più applicazioni contemporaneamente. Consigliamo agli utenti di sollecitare attentamente il modello quando richiedono attività complesse.
Affidabilità dello scorrimento: Mentre Claude Sonnet 3.5 (nuovo) aveva limitazioni con lo scorrimento, Claude Sonnet 3.7 introduce azioni di scorrimento dedicate con controllo della direzione che migliora l’affidabilità. Il modello può ora scorrere esplicitamente in qualsiasi direzione (su/giù/sinistra/destra) di una quantità specificata.
Interazione con fogli di calcolo: I clic del mouse per l’interazione con i fogli di calcolo sono migliorati in Claude Sonnet 3.7 con l’aggiunta di azioni di controllo del mouse più precise come left_mouse_down, left_mouse_up e nuovo supporto per i tasti modificatori. La selezione delle celle può essere più affidabile utilizzando questi controlli granulari e combinando i tasti modificatori con i clic.
Creazione di account e generazione di contenuti su piattaforme sociali e di comunicazione: Sebbene Claude visiterà siti web, stiamo limitando la sua capacità di creare account o generare e condividere contenuti o altrimenti impegnarsi nell’impersonificazione umana attraverso siti web e piattaforme di social media. Potremmo aggiornare questa capacità in futuro.
Vulnerabilità: Vulnerabilità come il jailbreaking o l’iniezione di prompt potrebbero persistere nei sistemi di IA di frontiera, inclusa l’API beta di utilizzo del computer. In alcune circostanze, Claude seguirà i comandi trovati nei contenuti, a volte anche in conflitto con le istruzioni dell’utente. Ad esempio, le istruzioni di Claude sulle pagine web o contenute nelle immagini potrebbero sovrascrivere le istruzioni o causare errori a Claude. Consigliamo: a. Limitare l’utilizzo del computer ad ambienti fidati come macchine virtuali o container con privilegi minimi b. Evitare di dare accesso all’utilizzo del computer ad account o dati sensibili senza una rigorosa supervisione c. Informare gli utenti finali dei rischi pertinenti e ottenere il loro consenso prima di abilitare o richiedere le autorizzazioni necessarie per le funzionalità di utilizzo del computer nelle tue applicazioni
Azioni inappropriate o illegali: Secondo i termini di servizio di Anthropic, non devi impiegare l’utilizzo del computer per violare leggi o la nostra Politica di Utilizzo Accettabile.

Rivedi e verifica sempre attentamente le azioni e i log di utilizzo del computer di Claude. Non utilizzare Claude per attività che richiedono una precisione perfetta o informazioni sensibili dell’utente senza supervisione umana.

Prezzi

Consulta la documentazione sui prezzi dell’utilizzo degli strumenti per una spiegazione dettagliata di come vengono prezzate le richieste API di Claude Tool Use.

Come sottoinsieme delle richieste di utilizzo degli strumenti, le richieste di utilizzo del computer hanno lo stesso prezzo di qualsiasi altra richiesta API Claude.

Includiamo anche automaticamente un prompt di sistema speciale per il modello, che abilita l’utilizzo del computer.

Modello	Scelta dello strumento	Conteggio token del prompt di sistema
Claude 4 Opus & Sonnet	`auto` `any`, `tool`	466 token 499 token
Claude Sonnet 3.7	`auto` `any`, `tool`	466 token 499 token
Claude Sonnet 3.5 (nuovo)	`auto` `any`, `tool`	466 token 499 token

Oltre ai token di base, sono necessari i seguenti token di input aggiuntivi per gli strumenti definiti da Anthropic:

Strumento	Token di input aggiuntivi
`computer_20250124` (Claude 4)	735 token
`computer_20250124` (Claude Sonnet 3.7)	735 token
`computer_20241022` (Claude Sonnet 3.5)	683 token
`text_editor_20250429` (Claude 4)	700 token
`text_editor_20250124` (Claude Sonnet 3.7)	700 token
`text_editor_20241022` (Claude Sonnet 3.5)	700 token
`bash_20250124` (Claude 4)	245 token
`bash_20250124` (Claude Sonnet 3.7)	245 token
`bash_20241022` (Claude Sonnet 3.5)	245 token

Se abiliti il pensiero con Claude 4 o Claude Sonnet 3.7, i token utilizzati per il pensiero verranno conteggiati rispetto al tuo budget di max_tokens in base ai budget_tokens che specifichi nel parametro di pensiero.

Release Notes

Implementazione di riferimento per l'utilizzo del computer

​Come funziona l’utilizzo del computer

​L’ambiente di calcolo

​Come implementare l’utilizzo del computer

​Inizia con la nostra implementazione di riferimento

​Comprendere il ciclo multi-agente

​Ottimizza le prestazioni del modello con il prompting

​Prompt di sistema

​Comprendere gli strumenti definiti da Anthropic

​Abilita la capacità di pensiero in Claude 4 e Claude Sonnet 3.7

​Combina l’utilizzo del computer con altri strumenti

​Costruisci un ambiente personalizzato per l’utilizzo del computer

​Comprendere i limiti dell’utilizzo del computer

​Prezzi

Come funziona l’utilizzo del computer

L’ambiente di calcolo

Come implementare l’utilizzo del computer

Inizia con la nostra implementazione di riferimento

Comprendere il ciclo multi-agente

Ottimizza le prestazioni del modello con il prompting

Prompt di sistema

Comprendere gli strumenti definiti da Anthropic

Abilita la capacità di pensiero in Claude 4 e Claude Sonnet 3.7

Combina l’utilizzo del computer con altri strumenti

Costruisci un ambiente personalizzato per l’utilizzo del computer

Comprendere i limiti dell’utilizzo del computer

Prezzi