Claude dapat berinteraksi dengan lingkungan komputer melalui tool penggunaan komputer, yang menyediakan kemampuan screenshot dan kontrol mouse/keyboard untuk interaksi desktop otonom.
"computer-use-2025-01-24"
(model Claude 4 dan Claude Sonnet 3.7)"computer-use-2024-10-22"
(Claude Sonnet 3.5 (deprecated))Model | Versi Tool | Flag Beta |
---|---|---|
Model Claude 4 | computer_20250124 | computer-use-2025-01-24 |
Claude Sonnet 3.7 | computer_20250124 | computer-use-2025-01-24 |
Claude Sonnet 3.5 v2 (deprecated) | computer_20241022 | computer-use-2024-10-22 |
1. Berikan Claude tool penggunaan komputer dan prompt pengguna
2. Claude memutuskan untuk menggunakan tool penggunaan komputer
stop_reason
dari tool_use
, menandakan niat Claude.3. Ekstrak input tool, evaluasi tool di komputer, dan kembalikan hasil
user
baru yang berisi blok konten tool_result
.4. Claude terus memanggil tool penggunaan komputer sampai menyelesaikan tugas
stop_reason
tool_use
lain dan Anda harus kembali ke langkah 3.Model Claude 4
computer_20250124
, sertakan flag beta ini:Claude Sonnet 3.7
computer_20250124
, sertakan flag beta ini:Claude Sonnet 3.5 v2 (deprecated)
computer_20241022
, sertakan flag beta ini:Setelah setiap langkah, ambil screenshot dan evaluasi dengan hati-hati apakah Anda telah mencapai hasil yang benar. Tunjukkan pemikiran Anda secara eksplisit: "Saya telah mengevaluasi langkah X..." Jika tidak benar, coba lagi. Hanya ketika Anda mengonfirmasi langkah telah dieksekusi dengan benar, Anda harus melanjutkan ke langkah berikutnya.
<robot_credentials>
. Menggunakan penggunaan komputer dalam aplikasi yang memerlukan login meningkatkan risiko hasil buruk sebagai akibat dari injeksi prompt. Harap tinjau panduan kami tentang mitigasi injeksi prompt sebelum memberikan kredensial login kepada model.Anda memiliki akses ke serangkaian fungsi yang dapat Anda gunakan untuk menjawab pertanyaan pengguna. Ini termasuk akses ke lingkungan komputasi yang terisolasi. Anda TIDAK saat ini memiliki kemampuan untuk memeriksa file atau berinteraksi dengan sumber daya eksternal, kecuali dengan memanggil fungsi di bawah ini.Seperti dengan penggunaan tool biasa, field
system_prompt
yang disediakan pengguna masih dihormati dan digunakan dalam konstruksi prompt sistem gabungan.
[x, y]
computer_20250124
)
Tersedia di model Claude 4 dan Claude Sonnet 3.7:
Contoh tindakan
Parameter | Wajib | Deskripsi |
---|---|---|
type | Ya | Versi tool (computer_20250124 atau computer_20241022 ) |
name | Ya | Harus “computer” |
display_width_px | Ya | Lebar display dalam piksel |
display_height_px | Ya | Tinggi display dalam piksel |
display_number | Tidak | Nomor display untuk lingkungan X11 |
thinking
ke permintaan API Anda:
budget_tokens
menentukan berapa banyak token yang dapat digunakan Claude untuk thinking. Ini dikurangi dari anggaran max_tokens
keseluruhan Anda.
Ketika thinking diaktifkan, Claude akan mengembalikan proses penalarannya sebagai bagian dari respons, yang dapat membantu Anda:
tool_use
menggunakan implementasi tool AndaSiapkan lingkungan komputasi Anda
Implementasikan handler tindakan
Proses panggilan tool Claude
Implementasikan loop agen
Kegagalan tangkapan screenshot
Koordinat tidak valid
Kegagalan eksekusi tindakan
Gunakan resolusi display yang sesuai
Implementasikan penanganan screenshot yang tepat
Tambahkan penundaan tindakan
Validasi tindakan sebelum eksekusi
Log tindakan untuk debugging
left_mouse_down
, left_mouse_up
, dan dukungan tombol modifier baru. Pemilihan sel dapat lebih andal dengan menggunakan kontrol halus ini dan menggabungkan tombol modifier dengan klik.Model | Input tokens per tool definition |
---|---|
Claude 4 / Sonnet 3.7 | 735 tokens |
Claude Sonnet 3.5 (deprecated) | 683 tokens |