Penggunaan Komputer (beta)
Model Claude 3.5 Sonnet yang ditingkatkan mampu berinteraksi dengan alat yang dapat memanipulasi lingkungan desktop komputer.
Model Claude 3.5 Sonnet yang ditingkatkan mampu berinteraksi dengan alat yang dapat memanipulasi lingkungan desktop komputer.
Penggunaan komputer adalah fitur beta. Harap sadari bahwa penggunaan komputer menimbulkan risiko unik yang berbeda dari fitur API standar atau antarmuka obrolan. Risiko ini meningkat ketika menggunakan penggunaan komputer untuk berinteraksi dengan internet. Untuk meminimalkan risiko, pertimbangkan untuk mengambil tindakan pencegahan seperti:
- Gunakan mesin virtual atau kontainer khusus dengan hak akses minimal untuk mencegah serangan sistem langsung atau kecelakaan.
- Hindari memberikan model akses ke data sensitif, seperti informasi login akun, untuk mencegah pencurian informasi.
- Batasi akses internet ke daftar putih domain untuk mengurangi paparan konten berbahaya.
- Mintalah manusia untuk mengonfirmasi keputusan yang dapat mengakibatkan konsekuensi dunia nyata yang berarti serta tugas apa pun yang memerlukan persetujuan afirmatif, seperti menerima cookie, melakukan transaksi keuangan, atau menyetujui ketentuan layanan.
Dalam beberapa keadaan, Claude akan mengikuti perintah yang ditemukan dalam konten bahkan jika bertentangan dengan instruksi pengguna. Misalnya, instruksi Claude di halaman web atau yang terkandung dalam gambar dapat mengganti instruksi atau menyebabkan Claude membuat kesalahan. Kami sarankan untuk mengambil tindakan pencegahan untuk mengisolasi Claude dari data dan tindakan sensitif untuk menghindari risiko terkait injeksi prompt.
Akhirnya, harap informasikan kepada pengguna akhir tentang risiko yang relevan dan dapatkan persetujuan mereka sebelum mengaktifkan penggunaan komputer di produk Anda sendiri.
Implementasi referensi penggunaan komputer
Mulai dengan cepat dengan implementasi referensi penggunaan komputer kami yang mencakup antarmuka web, kontainer Docker, implementasi alat contoh, dan loop agen.
Silakan gunakan formulir ini untuk memberikan umpan balik tentang kualitas respons model, API itu sendiri, atau kualitas dokumentasi - kami tidak sabar untuk mendengar dari Anda!
Berikut adalah contoh cara menyediakan alat penggunaan komputer untuk Claude menggunakan API Pesan:
Cara kerja penggunaan komputer
1. Berikan Claude alat penggunaan komputer dan prompt pengguna
- Tambahkan alat penggunaan komputer yang didefinisikan Anthropic ke permintaan API Anda.
- Sertakan prompt pengguna yang mungkin memerlukan alat-alat ini, misalnya “Simpan gambar kucing di desktop saya.”
2. Claude memutuskan untuk menggunakan alat
- Claude memuat definisi alat penggunaan komputer yang tersimpan dan menilai apakah ada alat yang dapat membantu dengan kueri pengguna.
- Jika ya, Claude membuat permintaan penggunaan alat yang diformat dengan benar.
- Respons API memiliki
stop_reason
daritool_use
, menandai niat Claude.
3. Ekstrak input alat, evaluasi alat pada komputer, dan kembalikan hasilnya
- Di sisi Anda, ekstrak nama alat dan input dari permintaan Claude.
- Gunakan alat pada kontainer atau Mesin Virtual.
- Lanjutkan percakapan dengan pesan
user
baru yang berisi blok kontentool_result
.
4. Claude terus memanggil alat penggunaan komputer hingga tugas selesai
- Claude menganalisis hasil alat untuk menentukan apakah penggunaan alat lain diperlukan atau tugas telah selesai.
- Jika Claude memutuskan membutuhkan alat lain, ia akan merespons dengan
stop_reason
tool_use
lain dan Anda harus kembali ke langkah 3. - Jika tidak, ia akan membuat respons teks untuk pengguna.
Kami menyebut pengulangan langkah 3 dan 4 tanpa input pengguna sebagai “loop agen” - yaitu, Claude merespons dengan permintaan penggunaan alat dan aplikasi Anda merespons Claude dengan hasil dari evaluasi permintaan tersebut.
Cara mengimplementasikan penggunaan komputer
Mulai dengan implementasi referensi kami
Kami telah membangun implementasi referensi yang mencakup semua yang Anda butuhkan untuk memulai dengan cepat penggunaan komputer:
- Lingkungan terkontainer yang sesuai untuk penggunaan komputer dengan Claude
- Implementasi alat penggunaan komputer
- Loop agen yang berinteraksi dengan API Anthropic dan mengeksekusi hasil penggunaan alat komputer
- Antarmuka web untuk berinteraksi dengan kontainer, loop agen, dan alat.
Kami merekomendasikan untuk mencoba implementasi referensi sebelum membaca dokumentasi ini.
Optimalkan kinerja model dengan prompting
Berikut adalah beberapa tips untuk mendapatkan output berkualitas terbaik:
- Spesifikasikan tugas yang sederhana dan terdefinisi dengan baik dan berikan instruksi eksplisit untuk setiap langkah.
- Claude terkadang mengasumsikan hasil tindakannya tanpa secara eksplisit memeriksa hasilnya. Untuk mencegah ini, Anda dapat memberi prompt Claude dengan
Setelah setiap langkah, ambil screenshot dan evaluasi dengan cermat apakah Anda telah mencapai hasil yang tepat. Tunjukkan pemikiran Anda secara eksplisit: "Saya telah mengevaluasi langkah X..." Jika tidak benar, coba lagi. Hanya ketika Anda mengonfirmasi langkah telah dieksekusi dengan benar, Anda harus melanjutkan ke langkah berikutnya.
- Beberapa elemen UI (seperti dropdown dan bilah gulir) mungkin sulit bagi Claude untuk dimanipulasi menggunakan gerakan mouse. Jika Anda mengalami ini, cobalah memberi prompt model untuk menggunakan pintasan keyboard.
- Untuk tugas atau interaksi UI yang dapat diulang, sertakan screenshot contoh dan panggilan alat dari hasil yang berhasil dalam prompt Anda.
- Jika Anda perlu model untuk masuk, berikan nama pengguna dan kata sandi dalam prompt Anda di dalam tag xml seperti
<robot_credentials>
. Menggunakan penggunaan komputer dalam aplikasi yang memerlukan login meningkatkan risiko hasil yang buruk akibat injeksi prompt. Harap tinjau panduan kami tentang mitigasi injeksi prompt sebelum memberikan model kredensial login.
Jika Anda berulang kali menemui serangkaian masalah yang jelas atau tahu sebelumnya tugas-tugas yang harus diselesaikan Claude, gunakan prompt sistem untuk memberikan Claude tips atau instruksi eksplisit tentang cara menyelesaikan tugas dengan sukses.
Prompt sistem
Ketika salah satu alat yang didefinisikan Anthropic diminta melalui API Anthropic, prompt sistem khusus penggunaan komputer akan dihasilkan. Mirip dengan prompt sistem penggunaan alat tetapi dimulai dengan:
Anda memiliki akses ke serangkaian fungsi yang dapat Anda gunakan untuk menjawab pertanyaan pengguna. Ini termasuk akses ke lingkungan komputasi terpasang. Anda SAAT INI tidak memiliki kemampuan untuk memeriksa file atau berinteraksi dengan sumber daya eksternal, kecuali dengan memanggil fungsi di bawah ini.
Seperti penggunaan alat biasa, bidang system_prompt
yang disediakan pengguna masih dihormati dan digunakan dalam konstruksi prompt sistem gabungan.
Memahami alat yang didefinisikan Anthropic
Sebagai beta, definisi alat ini dapat berubah.
Kami telah menyediakan serangkaian alat yang memungkinkan Claude untuk menggunakan komputer secara efektif. Saat menentukan alat yang didefinisikan Anthropic, bidang description
dan tool_schema
tidak diperlukan atau diizinkan.
Alat yang didefinisikan Anthropic dieksekusi oleh pengguna
Alat yang didefinisikan Anthropic didefinisikan oleh Anthropic tetapi Anda harus secara eksplisit mengevaluasi hasil alat dan mengembalikan tool_results
ke Claude. Seperti alat apa pun, model tidak secara otomatis mengeksekusi alat.
Kami saat ini menyediakan 3 alat yang didefinisikan Anthropic:
{ "type": "computer_20241022", "name": "computer" }
{ "type": "text_editor_20241022", "name": "str_replace_editor" }
{ "type": "bash_20241022", "name": "bash" }
Bidang type
mengidentifikasi alat dan parameternya untuk tujuan validasi, bidang name
adalah nama alat yang diekspos ke model.
Jika Anda ingin memberi prompt model untuk menggunakan salah satu alat ini, Anda dapat secara eksplisit merujuk alat dengan bidang name
. Bidang name
harus unik dalam daftar alat; Anda tidak dapat mendefinisikan alat dengan nama yang sama dengan alat yang didefinisikan Anthropic dalam panggilan API yang sama.
Kami tidak merekomendasikan mendefinisikan alat dengan nama alat yang didefinisikan Anthropic. Meskipun Anda masih dapat mendefinisikan ulang alat dengan nama ini (selama nama alat unik dalam blok tools
Anda), melakukannya dapat mengakibatkan kinerja model yang menurun.
Gabungkan penggunaan komputer dengan alat lain
Anda dapat menggabungkan penggunaan alat biasa dengan alat yang didefinisikan Anthropic untuk penggunaan komputer.
Bangun lingkungan penggunaan komputer khusus
Implementasi referensi dimaksudkan untuk membantu Anda memulai dengan penggunaan komputer. Ini mencakup semua komponen yang dibutuhkan agar Claude dapat menggunakan komputer. Namun, Anda dapat membangun lingkungan Anda sendiri untuk penggunaan komputer untuk memenuhi kebutuhan Anda. Anda membutuhkan:
- Lingkungan virtual atau terkontainer yang sesuai untuk penggunaan komputer dengan Claude
- Implementasi setidaknya satu dari alat penggunaan komputer yang didefinisikan Anthropic
- Loop agen yang berinteraksi dengan API Anthropic dan mengeksekusi hasil
tool_use
menggunakan implementasi alat Anda - API atau UI yang memungkinkan input pengguna untuk memulai loop agen
Memahami batasan penggunaan komputer
Fungsionalitas penggunaan komputer masih dalam tahap beta. Meskipun kemampuan Claude sangat mutakhir, pengembang harus menyadari keterbatasannya:
- Latensi: latensi penggunaan komputer saat ini untuk interaksi manusia-AI mungkin terlalu lambat dibandingkan dengan tindakan komputer yang diarahkan manusia secara langsung. Kami merekomendasikan untuk fokus pada kasus penggunaan di mana kecepatan tidak terlalu penting (misalnya, pengumpulan informasi latar belakang, pengujian perangkat lunak otomatis) di lingkungan tepercaya.
- Akurasi dan keandalan visi komputer: Claude mungkin membuat kesalahan atau menghayal saat mengeluarkan koordinat spesifik saat membuat tindakan.
- Akurasi dan keandalan pemilihan alat: Claude mungkin membuat kesalahan atau menghayal saat memilih alat saat membuat tindakan atau mengambil tindakan yang tidak diharapkan untuk memecahkan masalah. Selain itu, keandalan mungkin lebih rendah saat berinteraksi dengan aplikasi nis atau beberapa aplikasi sekaligus. Kami merekomendasikan agar pengguna memberi prompt model dengan hati-hati saat meminta tugas yang kompleks.
- Keandalan menggulir: Menggulir mungkin tidak andal dalam pengalaman saat ini, dan model mungkin tidak dapat menggulir ke bagian bawah halaman dengan andal. Perilaku seperti menggulir dapat ditingkatkan melalui pintasan keyboard (PgUp/PgDown).
- Interaksi spreadsheet: Klik mouse untuk interaksi spreadsheet tidak andal. Pemilihan sel mungkin tidak selalu bekerja seperti yang diharapkan. Ini dapat dimitigasi dengan memberi prompt model untuk menggunakan tombol panah.
- Pembuatan akun dan pembuatan konten di platform media sosial dan komunikasi: Meskipun Claude akan mengunjungi situs web, kami membatasi kemampuannya untuk membuat akun atau membuat dan membagikan konten atau terlibat dalam peniruan manusia di situs web dan platform media sosial. Kami mungkin memperbarui kemampuan ini di masa mendatang.
- Kerentanan: Kerentanan seperti jailbreaking atau injeksi prompt mungkin tetap ada di seluruh sistem AI frontier, termasuk API penggunaan komputer beta. Dalam beberapa keadaan, Claude akan mengikuti perintah yang ditemukan dalam konten, terkadang bahkan bertentangan dengan instruksi pengguna. Misalnya, instruksi Claude di halaman web atau yang terkandung dalam gambar dapat mengganti instruksi atau menyebabkan Claude membuat kesalahan. Kami merekomendasikan: a. Membatasi penggunaan komputer pada lingkungan tepercaya seperti mesin virtual atau kontainer dengan hak akses minimal b. Menghindari memberikan akses penggunaan komputer ke akun atau data sensitif tanpa pengawasan ketat c. Menginformasikan kepada pengguna akhir tentang risiko yang relevan dan mendapatkan persetujuan mereka sebelum mengaktifkan atau meminta izin yang diperlukan untuk fitur penggunaan komputer di aplikasi Anda
- Tindakan yang tidak pantas atau ilegal: Sesuai dengan Ketentuan Layanan Anthropic, Anda tidak boleh menggunakan penggunaan komputer untuk melanggar undang-undang atau Kebijakan Penggunaan yang Dapat Diterima kami.
Selalu tinjau dan verifikasi tindakan dan log penggunaan komputer Claude dengan cermat. Jangan gunakan Claude untuk tugas yang memerlukan presisi sempurna atau informasi pengguna sensitif tanpa pengawasan manusia.
Penentuan harga
Lihat dokumentasi penentuan harga penggunaan alat untuk penjelasan rinci tentang cara permintaan API Penggunaan Alat Claude dihargai.
Sebagai subset dari permintaan penggunaan alat, permintaan penggunaan komputer dihargai sama seperti permintaan API Claude lainnya.
Kami juga secara otomatis menyertakan prompt sistem khusus untuk model, yang memungkinkan penggunaan komputer.
Model | Pilihan alat | Jumlah token prompt sistem |
---|---|---|
Claude 3.5 Sonnet (baru) | auto any , tool | 466 token 499 token |
Selain token dasar, token input tambahan berikut diperlukan untuk alat yang didefinisikan Anthropic:
Alat | Token input tambahan |
---|---|
computer_20241022 | 683 token |
text_editor_20241022 | 700 token |
bash_20241022 | 245 token |
Was this page helpful?