Claude kann mit Computerumgebungen über das Computer use tool interagieren, das Screenshot-Funktionen und Maus-/Tastatursteuerung für autonome Desktop-Interaktion bietet.
"computer-use-2025-01-24"
(Claude 4 Modelle und Claude Sonnet 3.7)"computer-use-2024-10-22"
(Claude Sonnet 3.5 (veraltet))Modell | Tool-Version | Beta-Flag |
---|---|---|
Claude 4 Modelle | computer_20250124 | computer-use-2025-01-24 |
Claude Sonnet 3.7 | computer_20250124 | computer-use-2025-01-24 |
Claude Sonnet 3.5 v2 (veraltet) | computer_20241022 | computer-use-2024-10-22 |
1. Stellen Sie Claude das Computer use tool und einen Benutzer-Prompt zur Verfügung
2. Claude entscheidet, das Computer use tool zu verwenden
stop_reason
von tool_use
, der Claudes Absicht signalisiert.3. Tool-Input extrahieren, das Tool auf einem Computer auswerten und Ergebnisse zurückgeben
user
-Nachricht fort, die einen tool_result
-Inhaltsblock enthält.4. Claude ruft weiterhin Computer use tools auf, bis die Aufgabe abgeschlossen ist
tool_use
stop_reason
und Sie sollten zu Schritt 3 zurückkehren.Claude 4 Modelle
computer_20250124
, schließen Sie diesen Beta-Flag ein:Claude Sonnet 3.7
computer_20250124
, schließen Sie diesen Beta-Flag ein:Claude Sonnet 3.5 v2 (veraltet)
computer_20241022
, schließen Sie diesen Beta-Flag ein:Nach jedem Schritt mache einen Screenshot und bewerte sorgfältig, ob du das richtige Ergebnis erreicht hast. Zeige explizit dein Denken: "Ich habe Schritt X bewertet..." Wenn nicht korrekt, versuche es erneut. Nur wenn du bestätigst, dass ein Schritt korrekt ausgeführt wurde, solltest du zum nächsten übergehen.
<robot_credentials>
. Die Verwendung von Computer use in Anwendungen, die eine Anmeldung erfordern, erhöht das Risiko schlechter Ergebnisse als Folge von Prompt-Injection. Bitte lesen Sie unseren Leitfaden zur Minderung von Prompt-Injections, bevor Sie dem Modell Anmeldedaten zur Verfügung stellen.Sie haben Zugang zu einer Reihe von Funktionen, die Sie verwenden können, um die Frage des Benutzers zu beantworten. Dies umfasst den Zugang zu einer sandboxed Computing-Umgebung. Sie haben derzeit NICHT die Fähigkeit, Dateien zu inspizieren oder mit externen Ressourcen zu interagieren, außer durch das Aufrufen der unten stehenden Funktionen.Wie bei der regulären Tool-Verwendung wird das vom Benutzer bereitgestellte
system_prompt
-Feld weiterhin respektiert und bei der Konstruktion des kombinierten System-Prompts verwendet.
[x, y]
klickencomputer_20250124
)
Verfügbar in Claude 4 Modellen und Claude Sonnet 3.7:
Beispielaktionen
Parameter | Erforderlich | Beschreibung |
---|---|---|
type | Ja | Tool-Version (computer_20250124 oder computer_20241022 ) |
name | Ja | Muss “computer” sein |
display_width_px | Ja | Display-Breite in Pixeln |
display_height_px | Ja | Display-Höhe in Pixeln |
display_number | Nein | Display-Nummer für X11-Umgebungen |
thinking
-Parameter zu Ihrer API-Anfrage hinzu:
budget_tokens
-Parameter spezifiziert, wie viele Tokens Claude für das Denken verwenden kann. Dies wird von Ihrem gesamten max_tokens
-Budget abgezogen.
Wenn Thinking aktiviert ist, gibt Claude seinen Denkprozess als Teil der Antwort zurück, was Ihnen helfen kann:
tool_use
-Ergebnisse mit Ihren Tool-Implementierungen ausführtIhre Computing-Umgebung einrichten
Action-Handler implementieren
Claudes Tool-Aufrufe verarbeiten
Die Agent-Schleife implementieren
Screenshot-Erfassung fehlgeschlagen
Ungültige Koordinaten
Action-Ausführung fehlgeschlagen
Angemessene Display-Auflösung verwenden
Ordnungsgemäße Screenshot-Behandlung implementieren
Action-Verzögerungen hinzufügen
Aktionen vor der Ausführung validieren
Aktionen für Debugging protokollieren
left_mouse_down
, left_mouse_up
und neuer Modifier-Tasten-Unterstützung verbessert. Zellenauswahl kann zuverlässiger sein, indem diese feinkörnigen Steuerungen verwendet und Modifier-Tasten mit Klicks kombiniert werden.Model | Input tokens per tool definition |
---|---|
Claude 4 / Sonnet 3.7 | 735 tokens |
Claude Sonnet 3.5 (deprecated) | 683 tokens |