Tool penggunaan komputer

Claude dapat berinteraksi dengan lingkungan komputer melalui tool penggunaan komputer, yang menyediakan kemampuan screenshot dan kontrol mouse/keyboard untuk interaksi desktop otonom.

Penggunaan komputer saat ini dalam beta dan memerlukan header beta:

"computer-use-2025-01-24" (model Claude 4 dan Claude Sonnet 3.7)
"computer-use-2024-10-22" (Claude Sonnet 3.5 (deprecated))

Gambaran Umum

Penggunaan komputer adalah fitur beta yang memungkinkan Claude berinteraksi dengan lingkungan desktop. Tool ini menyediakan:

Tangkapan screenshot: Melihat apa yang sedang ditampilkan di layar
Kontrol mouse: Klik, seret, dan gerakkan kursor
Input keyboard: Ketik teks dan gunakan shortcut keyboard
Otomasi desktop: Berinteraksi dengan aplikasi atau antarmuka apa pun

Meskipun penggunaan komputer dapat diperkuat dengan tool lain seperti bash dan text editor untuk alur kerja otomasi yang lebih komprehensif, penggunaan komputer secara khusus merujuk pada kemampuan tool penggunaan komputer untuk melihat dan mengontrol lingkungan desktop.

Kompatibilitas model

Penggunaan komputer tersedia untuk model Claude berikut:

Model	Versi Tool	Flag Beta
Model Claude 4	`computer_20250124`	`computer-use-2025-01-24`
Claude Sonnet 3.7	`computer_20250124`	`computer-use-2025-01-24`
Claude Sonnet 3.5 v2 (deprecated)	`computer_20241022`	`computer-use-2024-10-22`

Model Claude 4 menggunakan versi tool yang diperbarui yang dioptimalkan untuk arsitektur baru. Claude Sonnet 3.7 memperkenalkan kemampuan tambahan termasuk fitur thinking untuk lebih banyak wawasan tentang proses penalaran model.

Pertimbangan keamanan

Penggunaan komputer adalah fitur beta dengan risiko unik yang berbeda dari fitur API standar. Risiko ini meningkat saat berinteraksi dengan internet. Untuk meminimalkan risiko, pertimbangkan untuk mengambil tindakan pencegahan seperti:

Gunakan mesin virtual khusus atau container dengan hak istimewa minimal untuk mencegah serangan sistem langsung atau kecelakaan.
Hindari memberikan akses model ke data sensitif, seperti informasi login akun, untuk mencegah pencurian informasi.
Batasi akses internet ke daftar domain yang diizinkan untuk mengurangi paparan terhadap konten berbahaya.
Minta manusia untuk mengonfirmasi keputusan yang dapat menghasilkan konsekuensi dunia nyata yang bermakna serta tugas apa pun yang memerlukan persetujuan afirmatif, seperti menerima cookie, melakukan transaksi keuangan, atau menyetujui syarat layanan.

Dalam beberapa keadaan, Claude akan mengikuti perintah yang ditemukan dalam konten bahkan jika bertentangan dengan instruksi pengguna. Misalnya, instruksi Claude di halaman web atau yang terkandung dalam gambar dapat mengesampingkan instruksi atau menyebabkan Claude membuat kesalahan. Kami menyarankan untuk mengambil tindakan pencegahan untuk mengisolasi Claude dari data dan tindakan sensitif untuk menghindari risiko yang terkait dengan injeksi prompt.Kami telah melatih model untuk menahan injeksi prompt ini dan telah menambahkan lapisan pertahanan ekstra. Jika Anda menggunakan tool penggunaan komputer kami, kami akan secara otomatis menjalankan classifier pada prompt Anda untuk menandai kemungkinan instance injeksi prompt. Ketika classifier ini mengidentifikasi kemungkinan injeksi prompt dalam screenshot, mereka akan secara otomatis mengarahkan model untuk meminta konfirmasi pengguna sebelum melanjutkan dengan tindakan berikutnya. Kami menyadari bahwa perlindungan ekstra ini tidak akan ideal untuk setiap kasus penggunaan (misalnya, kasus penggunaan tanpa manusia dalam loop), jadi jika Anda ingin memilih keluar dan mematikannya, silakan hubungi kami.Kami masih menyarankan untuk mengambil tindakan pencegahan untuk mengisolasi Claude dari data dan tindakan sensitif untuk menghindari risiko yang terkait dengan injeksi prompt.Akhirnya, harap informasikan pengguna akhir tentang risiko yang relevan dan dapatkan persetujuan mereka sebelum mengaktifkan penggunaan komputer dalam produk Anda sendiri.

Implementasi referensi penggunaan komputer

Mulai dengan cepat dengan implementasi referensi penggunaan komputer kami yang mencakup antarmuka web, container Docker, implementasi tool contoh, dan loop agen.Catatan: Implementasi telah diperbarui untuk menyertakan tool baru untuk model Claude 4 dan Claude Sonnet 3.7. Pastikan untuk menarik versi terbaru dari repo untuk mengakses fitur baru ini.

Silakan gunakan formulir ini untuk memberikan umpan balik tentang kualitas respons model, API itu sendiri, atau kualitas dokumentasi - kami tidak sabar mendengar dari Anda!

Mulai cepat

Berikut cara memulai dengan penggunaan komputer:

import anthropic

client = anthropic.Anthropic()

response = client.beta.messages.create(
    model="claude-sonnet-4-20250514",  # atau model kompatibel lainnya
    max_tokens=1024,
    tools=[
        {
          "type": "computer_20250124",
          "name": "computer",
          "display_width_px": 1024,
          "display_height_px": 768,
          "display_number": 1,
        },
        {
          "type": "text_editor_20250124",
          "name": "str_replace_editor"
        },
        {
          "type": "bash_20250124",
          "name": "bash"
        }
    ],
    messages=[{"role": "user", "content": "Simpan gambar kucing ke desktop saya."}],
    betas=["computer-use-2025-01-24"]
)
print(response)

Persyaratan header beta:

Model Claude 4 dan Claude Sonnet 3.7: Header beta hanya diperlukan untuk tool penggunaan komputer
Claude Sonnet 3.5 (deprecated): Header beta diperlukan untuk tool komputer, bash, dan text editor

Contoh di atas menunjukkan ketiga tool yang digunakan bersama, yang memerlukan header beta untuk model Claude mana pun karena menyertakan tool penggunaan komputer.

Cara kerja penggunaan komputer

1. Berikan Claude tool penggunaan komputer dan prompt pengguna

Tambahkan tool penggunaan komputer (dan opsional tool lain) ke permintaan API Anda.
Sertakan prompt pengguna yang memerlukan interaksi desktop, misalnya, “Simpan gambar kucing ke desktop saya.”

2. Claude memutuskan untuk menggunakan tool penggunaan komputer

Claude menilai apakah tool penggunaan komputer dapat membantu dengan kueri pengguna.
Jika ya, Claude membuat permintaan penggunaan tool yang diformat dengan benar.
Respons API memiliki stop_reason dari tool_use, menandakan niat Claude.

3. Ekstrak input tool, evaluasi tool di komputer, dan kembalikan hasil

Di sisi Anda, ekstrak nama tool dan input dari permintaan Claude.
Gunakan tool di container atau Mesin Virtual.
Lanjutkan percakapan dengan pesan user baru yang berisi blok konten tool_result.

4. Claude terus memanggil tool penggunaan komputer sampai menyelesaikan tugas

Claude menganalisis hasil tool untuk menentukan apakah diperlukan lebih banyak penggunaan tool atau tugas telah selesai.
Jika Claude memutuskan memerlukan tool lain, ia merespons dengan stop_reason tool_use lain dan Anda harus kembali ke langkah 3.
Jika tidak, ia membuat respons teks untuk pengguna.

Kami merujuk pada pengulangan langkah 3 dan 4 tanpa input pengguna sebagai “loop agen” - yaitu, Claude merespons dengan permintaan penggunaan tool dan aplikasi Anda merespons Claude dengan hasil evaluasi permintaan tersebut.

Lingkungan komputasi

Penggunaan komputer memerlukan lingkungan komputasi yang terisolasi di mana Claude dapat berinteraksi dengan aman dengan aplikasi dan web. Lingkungan ini mencakup:

Display virtual: Server display virtual X11 (menggunakan Xvfb) yang merender antarmuka desktop yang akan dilihat Claude melalui screenshot dan dikontrol dengan tindakan mouse/keyboard.
Lingkungan desktop: UI ringan dengan window manager (Mutter) dan panel (Tint2) yang berjalan di Linux, yang menyediakan antarmuka grafis yang konsisten untuk berinteraksi dengan Claude.
Aplikasi: Aplikasi Linux yang telah diinstal sebelumnya seperti Firefox, LibreOffice, text editor, dan file manager yang dapat digunakan Claude untuk menyelesaikan tugas.
Implementasi tool: Kode integrasi yang menerjemahkan permintaan tool abstrak Claude (seperti “gerakkan mouse” atau “ambil screenshot”) menjadi operasi aktual di lingkungan virtual.
Loop agen: Program yang menangani komunikasi antara Claude dan lingkungan, mengirim tindakan Claude ke lingkungan dan mengembalikan hasil (screenshot, output perintah) kembali ke Claude.

Ketika Anda menggunakan penggunaan komputer, Claude tidak terhubung langsung ke lingkungan ini. Sebaliknya, aplikasi Anda:

Menerima permintaan penggunaan tool Claude
Menerjemahkannya menjadi tindakan di lingkungan komputasi Anda
Menangkap hasil (screenshot, output perintah, dll.)
Mengembalikan hasil ini ke Claude

Untuk keamanan dan isolasi, implementasi referensi menjalankan semua ini di dalam container Docker dengan pemetaan port yang sesuai untuk melihat dan berinteraksi dengan lingkungan.

Cara mengimplementasikan penggunaan komputer

Mulai dengan implementasi referensi kami

Kami telah membangun implementasi referensi yang mencakup semua yang Anda butuhkan untuk memulai dengan cepat dengan penggunaan komputer:

Lingkungan containerized yang cocok untuk penggunaan komputer dengan Claude
Implementasi tool penggunaan komputer
Loop agen yang berinteraksi dengan API Anthropic dan mengeksekusi tool penggunaan komputer
Antarmuka web untuk berinteraksi dengan container, loop agen, dan tool.

Memahami loop multi-agen

Inti dari penggunaan komputer adalah “loop agen” - siklus di mana Claude meminta tindakan tool, aplikasi Anda mengeksekusinya, dan mengembalikan hasil ke Claude. Berikut contoh yang disederhanakan:

async def sampling_loop(
    *,
    model: str,
    messages: list[dict],
    api_key: str,
    max_tokens: int = 4096,
    tool_version: str,
    thinking_budget: int | None = None,
    max_iterations: int = 10,  # Tambahkan batas iterasi untuk mencegah loop tak terbatas
):
    """
    Loop agen sederhana untuk interaksi penggunaan komputer Claude.

    Fungsi ini menangani bolak-balik antara:
    1. Mengirim pesan pengguna ke Claude
    2. Claude meminta untuk menggunakan tool
    3. Aplikasi Anda mengeksekusi tool tersebut
    4. Mengirim hasil tool kembali ke Claude
    """
    # Siapkan tool dan parameter API
    client = Anthropic(api_key=api_key)
    beta_flag = "computer-use-2025-01-24" if "20250124" in tool_version else "computer-use-2024-10-22"

    # Konfigurasi tool - Anda harus sudah menginisialisasi ini di tempat lain
    tools = [
        {"type": f"computer_{tool_version}", "name": "computer", "display_width_px": 1024, "display_height_px": 768},
        {"type": f"text_editor_{tool_version}", "name": "str_replace_editor"},
        {"type": f"bash_{tool_version}", "name": "bash"}
    ]

    # Loop agen utama (dengan batas iterasi untuk mencegah biaya API yang tidak terkendali)
    iterations = 0
    while True and iterations < max_iterations:
        iterations += 1
        # Siapkan parameter thinking opsional (untuk Claude Sonnet 3.7)
        thinking = None
        if thinking_budget:
            thinking = {"type": "enabled", "budget_tokens": thinking_budget}

        # Panggil API Claude
        response = client.beta.messages.create(
            model=model,
            max_tokens=max_tokens,
            messages=messages,
            tools=tools,
            betas=[beta_flag],
            thinking=thinking
        )

        # Tambahkan respons Claude ke riwayat percakapan
        response_content = response.content
        messages.append({"role": "assistant", "content": response_content})

        # Periksa apakah Claude menggunakan tool apa pun
        tool_results = []
        for block in response_content:
            if block.type == "tool_use":
                # Dalam aplikasi nyata, Anda akan mengeksekusi tool di sini
                # Misalnya: result = run_tool(block.name, block.input)
                result = {"result": "Tool berhasil dieksekusi"}

                # Format hasil untuk Claude
                tool_results.append({
                    "type": "tool_result",
                    "tool_use_id": block.id,
                    "content": result
                })

        # Jika tidak ada tool yang digunakan, Claude selesai - kembalikan pesan final
        if not tool_results:
            return messages

        # Tambahkan hasil tool ke pesan untuk iterasi berikutnya dengan Claude
        messages.append({"role": "user", "content": tool_results})

Loop berlanjut sampai Claude merespons tanpa meminta tool apa pun (penyelesaian tugas) atau batas iterasi maksimum tercapai. Pengamanan ini mencegah kemungkinan loop tak terbatas yang dapat menghasilkan biaya API yang tidak terduga.

Ketika menggunakan tool penggunaan komputer, Anda harus menyertakan flag beta yang sesuai untuk versi model Anda:

Model Claude 4

Claude Sonnet 3.7

Claude Sonnet 3.5 v2 (deprecated)

Catatan: Untuk model Claude 4 dan Claude Sonnet 3.7, flag beta hanya diperlukan untuk tool penggunaan komputer. Untuk Claude Sonnet 3.5 (deprecated), flag beta diperlukan untuk tool komputer, bash, dan text editor.

Kami merekomendasikan untuk mencoba implementasi referensi sebelum membaca sisa dokumentasi ini.

Optimalkan performa model dengan prompting

Berikut beberapa tips tentang cara mendapatkan output berkualitas terbaik:

Tentukan tugas yang sederhana dan terdefinisi dengan baik dan berikan instruksi eksplisit untuk setiap langkah.
Claude terkadang mengasumsikan hasil tindakannya tanpa secara eksplisit memeriksa hasilnya. Untuk mencegah ini, Anda dapat meminta Claude dengan Setelah setiap langkah, ambil screenshot dan evaluasi dengan hati-hati apakah Anda telah mencapai hasil yang benar. Tunjukkan pemikiran Anda secara eksplisit: "Saya telah mengevaluasi langkah X..." Jika tidak benar, coba lagi. Hanya ketika Anda mengonfirmasi langkah telah dieksekusi dengan benar, Anda harus melanjutkan ke langkah berikutnya.
Beberapa elemen UI (seperti dropdown dan scrollbar) mungkin sulit dimanipulasi Claude menggunakan gerakan mouse. Jika Anda mengalami ini, coba meminta model untuk menggunakan shortcut keyboard.
Untuk tugas yang dapat diulang atau interaksi UI, sertakan contoh screenshot dan panggilan tool dari hasil yang berhasil dalam prompt Anda.
Jika Anda perlu model untuk login, berikan username dan password dalam prompt Anda di dalam tag xml seperti <robot_credentials>. Menggunakan penggunaan komputer dalam aplikasi yang memerlukan login meningkatkan risiko hasil buruk sebagai akibat dari injeksi prompt. Harap tinjau panduan kami tentang mitigasi injeksi prompt sebelum memberikan kredensial login kepada model.

Jika Anda berulang kali menghadapi serangkaian masalah yang jelas atau mengetahui sebelumnya tugas yang perlu diselesaikan Claude, gunakan prompt sistem untuk memberikan Claude tips atau instruksi eksplisit tentang cara melakukan tugas dengan berhasil.

Prompt sistem

Ketika salah satu tool yang didefinisikan Anthropic diminta melalui API Anthropic, prompt sistem khusus penggunaan komputer dihasilkan. Ini mirip dengan prompt sistem penggunaan tool tetapi dimulai dengan:

Anda memiliki akses ke serangkaian fungsi yang dapat Anda gunakan untuk menjawab pertanyaan pengguna. Ini termasuk akses ke lingkungan komputasi yang terisolasi. Anda TIDAK saat ini memiliki kemampuan untuk memeriksa file atau berinteraksi dengan sumber daya eksternal, kecuali dengan memanggil fungsi di bawah ini.

Seperti dengan penggunaan tool biasa, field system_prompt yang disediakan pengguna masih dihormati dan digunakan dalam konstruksi prompt sistem gabungan.

Tindakan yang tersedia

Tool penggunaan komputer mendukung tin dakan-tindakan ini: Tindakan dasar (semua versi)

screenshot - Tangkap display saat ini
left_click - Klik pada koordinat [x, y]
type - Ketik string teks
key - Tekan tombol atau kombinasi tombol (misalnya, “ctrl+s”)
mouse_move - Gerakkan kursor ke koordinat

Tindakan yang ditingkatkan (computer_20250124) Tersedia di model Claude 4 dan Claude Sonnet 3.7:

scroll - Scroll ke arah mana pun dengan kontrol jumlah
left_click_drag - Klik dan seret antara koordinat
right_click, middle_click - Tombol mouse tambahan
double_click, triple_click - Klik ganda
left_mouse_down, left_mouse_up - Kontrol klik yang halus
hold_key - Tahan tombol sambil melakukan tindakan lain
wait - Jeda antara tindakan

Contoh tindakan

// Ambil screenshot
{
  "action": "screenshot"
}

// Klik pada posisi
{
  "action": "left_click",
  "coordinate": [500, 300]
}

// Ketik teks
{
  "action": "type",
  "text": "Halo, dunia!"
}

// Scroll ke bawah (Claude 4/3.7)
{
  "action": "scroll",
  "coordinate": [500, 400],
  "scroll_direction": "down",
  "scroll_amount": 3
}

Parameter tool

Parameter	Wajib	Deskripsi
`type`	Ya	Versi tool (`computer_20250124` atau `computer_20241022`)
`name`	Ya	Harus “computer”
`display_width_px`	Ya	Lebar display dalam piksel
`display_height_px`	Ya	Tinggi display dalam piksel
`display_number`	Tidak	Nomor display untuk lingkungan X11

Jaga resolusi display pada atau di bawah 1280x800 (WXGA) untuk performa terbaik. Resolusi yang lebih tinggi dapat menyebabkan masalah akurasi karena pengubahan ukuran gambar.

Penting: Tool penggunaan komputer harus dieksekusi secara eksplisit oleh aplikasi Anda - Claude tidak dapat mengeksekusinya secara langsung. Anda bertanggung jawab untuk mengimplementasikan tangkapan screenshot, gerakan mouse, input keyboard, dan tindakan lain berdasarkan permintaan Claude.

Aktifkan kemampuan thinking di model Claude 4 dan Claude Sonnet 3.7

Claude Sonnet 3.7 memperkenalkan kemampuan “thinking” baru yang memungkinkan Anda melihat proses penalaran model saat bekerja melalui tugas kompleks. Fitur ini membantu Anda memahami bagaimana Claude mendekati masalah dan dapat sangat berharga untuk debugging atau tujuan pendidikan. Untuk mengaktifkan thinking, tambahkan parameter thinking ke permintaan API Anda:

"thinking": {
  "type": "enabled",
  "budget_tokens": 1024
}

Parameter budget_tokens menentukan berapa banyak token yang dapat digunakan Claude untuk thinking. Ini dikurangi dari anggaran max_tokens keseluruhan Anda. Ketika thinking diaktifkan, Claude akan mengembalikan proses penalarannya sebagai bagian dari respons, yang dapat membantu Anda:

Memahami proses pengambilan keputusan model
Mengidentifikasi masalah atau kesalahpahaman potensial
Belajar dari pendekatan Claude untuk pemecahan masalah
Mendapatkan lebih banyak visibilitas ke dalam operasi multi-langkah yang kompleks

Berikut contoh seperti apa output thinking mungkin terlihat:

[Thinking]
Saya perlu menyimpan gambar kucing ke desktop. Mari saya bagi ini menjadi langkah-langkah:

1. Pertama, saya akan mengambil screenshot untuk melihat apa yang ada di desktop
2. Kemudian saya akan mencari browser web untuk mencari gambar kucing
3. Setelah menemukan gambar yang cocok, saya perlu menyimpannya ke desktop

Mari saya mulai dengan mengambil screenshot untuk melihat apa yang tersedia...

Memperkuat penggunaan komputer dengan tool lain

Tool penggunaan komputer dapat dikombinasikan dengan tool lain untuk membuat alur kerja otomasi yang lebih kuat. Ini sangat berguna ketika Anda perlu:

Mengeksekusi perintah sistem (tool bash)
Mengedit file konfigurasi atau skrip (tool text editor)
Mengintegrasikan dengan API atau layanan kustom (tool kustom)

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: computer-use-2025-01-24" \
  -d '{
    "model": "claude-opus-4-1-20250805",
    "max_tokens": 2000,
    "tools": [
      {
        "type": "computer_20250124",
        "name": "computer",
        "display_width_px": 1024,
        "display_height_px": 768,
        "display_number": 1
      },
      {
        "type": "text_editor_20250124",
        "name": "str_replace_editor"
      },
      {
        "type": "bash_20250124",
        "name": "bash"
      },
      {
        "name": "get_weather",
        "description": "Dapatkan cuaca saat ini di lokasi tertentu",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "Kota dan negara bagian, misalnya San Francisco, CA"
            },
            "unit": {
              "type": "string",
              "enum": ["celsius", "fahrenheit"],
              "description": "Unit suhu, baik 'celsius' atau 'fahrenheit'"
            }
          },
          "required": ["location"]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Temukan penerbangan dari San Francisco ke tempat dengan cuaca yang lebih hangat."
      }
    ],
    "thinking": {
      "type": "enabled",
      "budget_tokens": 1024
    }
  }'

Bangun lingkungan penggunaan komputer kustom

Implementasi referensi dimaksudkan untuk membantu Anda memulai dengan penggunaan komputer. Ini mencakup semua komponen yang diperlukan agar Claude menggunakan komputer. Namun, Anda dapat membangun lingkungan Anda sendiri untuk penggunaan komputer sesuai kebutuhan Anda. Anda akan memerlukan:

Lingkungan yang divirtualisasi atau dikontainerisasi yang cocok untuk penggunaan komputer dengan Claude
Implementasi setidaknya satu dari tool penggunaan komputer yang didefinisikan Anthropic
Loop agen yang berinteraksi dengan API Anthropic dan mengeksekusi hasil tool_use menggunakan implementasi tool Anda
API atau UI yang memungkinkan input pengguna untuk memulai loop agen

Implementasikan tool penggunaan komputer

Tool penggunaan komputer diimplementasikan sebagai tool tanpa skema. Ketika menggunakan tool ini, Anda tidak perlu menyediakan skema input seperti dengan tool lain; skema dibangun ke dalam model Claude dan tidak dapat dimodifikasi.

Siapkan lingkungan komputasi Anda

Buat display virtual atau hubungkan ke display yang ada yang akan berinteraksi dengan Claude. Ini biasanya melibatkan pengaturan Xvfb (X Virtual Framebuffer) atau teknologi serupa.

Implementasikan handler tindakan

Buat fungsi untuk menangani setiap jenis tindakan yang mungkin diminta Claude:

def handle_computer_action(action_type, params):
    if action_type == "screenshot":
        return capture_screenshot()
    elif action_type == "left_click":
        x, y = params["coordinate"]
        return click_at(x, y)
    elif action_type == "type":
        return type_text(params["text"])
    # ... tangani tindakan lain

Proses panggilan tool Claude

Ekstrak dan eksekusi panggilan tool dari respons Claude:

for content in response.content:
    if content.type == "tool_use":
        action = content.input["action"]
        result = handle_computer_action(action, content.input)
        
        # Kembalikan hasil ke Claude
        tool_result = {
            "type": "tool_result",
            "tool_use_id": content.id,
            "content": result
        }

Implementasikan loop agen

Buat loop yang berlanjut sampai Claude menyelesaikan tugas:

while True:
    response = client.beta.messages.create(...)
    
    # Periksa apakah Claude menggunakan tool apa pun
    tool_results = process_tool_calls(response)
    
    if not tool_results:
        # Tidak ada lagi penggunaan tool, tugas selesai
        break
        
    # Lanjutkan percakapan dengan hasil tool
    messages.append({"role": "user", "content": tool_results})

Tangani error

Ketika mengimplementasikan tool penggunaan komputer, berbagai error mungkin terjadi. Berikut cara menanganinya:

Kegagalan tangkapan screenshot

Jika tangkapan screenshot gagal, kembalikan pesan error yang sesuai:

{
  "role": "user",
  "content": [
    {
      "type": "tool_result",
      "tool_use_id": "toolu_01A09q90qw90lq917835lq9",
      "content": "Error: Gagal menangkap screenshot. Display mungkin terkunci atau tidak tersedia.",
      "is_error": true
    }
  ]
}

Koordinat tidak valid

Jika Claude memberikan koordinat di luar batas display:

{
  "role": "user",
  "content": [
    {
      "type": "tool_result",
      "tool_use_id": "toolu_01A09q90qw90lq917835lq9",
      "content": "Error: Koordinat (1200, 900) berada di luar batas display (1024x768).",
      "is_error": true
    }
  ]
}

Kegagalan eksekusi tindakan

Jika tindakan gagal dieksekusi:

{
  "role": "user",
  "content": [
    {
      "type": "tool_result",
      "tool_use_id": "toolu_01A09q90qw90lq917835lq9",
      "content": "Error: Gagal melakukan tindakan klik. Aplikasi mungkin tidak responsif.",
      "is_error": true
    }
  ]
}

Ikuti praktik terbaik implementasi

Gunakan resolusi display yang sesuai

Implementasikan penanganan screenshot yang tepat

Tambahkan penundaan tindakan

Validasi tindakan sebelum eksekusi

Periksa bahwa tindakan yang diminta aman dan valid:

def validate_action(action_type, params):
    if action_type == "left_click":
        x, y = params.get("coordinate", (0, 0))
        if not (0 <= x < display_width and 0 <= y < display_height):
            return False, "Koordinat di luar batas"
    return True, None

Log tindakan untuk debugging

Memahami keterbatasan penggunaan komputer

Fungsionalitas penggunaan komputer dalam beta. Meskipun kemampuan Claude canggih, pengembang harus menyadari keterbatasannya:

Latensi: latensi penggunaan komputer saat ini untuk interaksi manusia-AI mungkin terlalu lambat dibandingkan dengan tindakan komputer yang diarahkan manusia biasa. Kami merekomendasikan fokus pada kasus penggunaan di mana kecepatan tidak kritis (misalnya, pengumpulan informasi latar belakang, pengujian perangkat lunak otomatis) di lingkungan terpercaya.
Akurasi dan keandalan computer vision: Claude mungkin membuat kesalahan atau berhalusinasi saat mengeluarkan koordinat spesifik sambil menghasilkan tindakan. Claude Sonnet 3.7 memperkenalkan kemampuan thinking yang dapat membantu Anda memahami penalaran model dan mengidentifikasi masalah potensial.
Akurasi dan keandalan pemilihan tool: Claude mungkin membuat kesalahan atau berhalusinasi saat memilih tool sambil menghasilkan tindakan atau mengambil tindakan tak terduga untuk memecahkan masalah. Selain itu, keandalan mungkin lebih rendah saat berinteraksi dengan aplikasi niche atau beberapa aplikasi sekaligus. Kami merekomendasikan agar pengguna meminta model dengan hati-hati saat meminta tugas kompleks.
Keandalan scrolling: Meskipun Claude Sonnet 3.5 v2 (deprecated) memiliki keterbatasan dengan scrolling, Claude Sonnet 3.7 memperkenalkan tindakan scroll khusus dengan kontrol arah yang meningkatkan keandalan. Model sekarang dapat secara eksplisit scroll ke arah mana pun (atas/bawah/kiri/kanan) dengan jumlah yang ditentukan.
Interaksi spreadsheet: Klik mouse untuk interaksi spreadsheet telah meningkat di Claude Sonnet 3.7 dengan penambahan tindakan kontrol mouse yang lebih presisi seperti left_mouse_down, left_mouse_up, dan dukungan tombol modifier baru. Pemilihan sel dapat lebih andal dengan menggunakan kontrol halus ini dan menggabungkan tombol modifier dengan klik.
Pembuatan akun dan generasi konten di platform sosial dan komunikasi: Meskipun Claude akan mengunjungi situs web, kami membatasi kemampuannya untuk membuat akun atau menghasilkan dan berbagi konten atau terlibat dalam peniruan manusia di situs web media sosial dan platform. Kami mungkin memperbarui kemampuan ini di masa depan.
Kerentanan: Kerentanan seperti jailbreaking atau injeksi prompt mungkin bertahan di sistem AI frontier, termasuk API penggunaan komputer beta. Dalam beberapa keadaan, Claude akan mengikuti perintah yang ditemukan dalam konten, terkadang bahkan bertentangan dengan instruksi pengguna. Misalnya, instruksi Claude di halaman web atau yang terkandung dalam gambar dapat mengesampingkan instruksi atau menyebabkan Claude membuat kesalahan. Kami merekomendasikan: a. Membatasi penggunaan komputer ke lingkungan terpercaya seperti mesin virtual atau container dengan hak istimewa minimal b. Menghindari memberikan akses penggunaan komputer ke akun atau data sensitif tanpa pengawasan ketat c. Menginformasikan pengguna akhir tentang risiko yang relevan dan mendapatkan persetujuan mereka sebelum mengaktifkan atau meminta izin yang diperlukan untuk fitur penggunaan komputer dalam aplikasi Anda
Tindakan yang tidak pantas atau ilegal: Sesuai syarat layanan Anthropic, Anda tidak boleh menggunakan penggunaan komputer untuk melanggar hukum apa pun atau Kebijakan Penggunaan yang Dapat Diterima kami.

Selalu tinjau dan verifikasi tindakan dan log penggunaan komputer Claude dengan hati-hati. Jangan gunakan Claude untuk tugas yang memerlukan presisi sempurna atau informasi pengguna sensitif tanpa pengawasan manusia.

Harga

Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:

Model	Input tokens per tool definition
Claude 4 / Sonnet 3.7	735 tokens
Claude Sonnet 3.5 (deprecated)	683 tokens

Additional token consumption:

Screenshot images (see Vision pricing)
Tool execution results returned to Claude

If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Langkah pertama

Model & harga

Pelajari tentang Claude

Kemampuan

Alat

Model Context Protocol (MCP)

Kasus penggunaan

Rekayasa prompt

Uji & evaluasi

Perkuat pagar pengaman

Pusat Hukum

Tool penggunaan komputer

Gambaran Umum

Kompatibilitas model

Pertimbangan keamanan

Implementasi referensi penggunaan komputer

Mulai cepat

Cara kerja penggunaan komputer

Lingkungan komputasi

Cara mengimplementasikan penggunaan komputer

Mulai dengan implementasi referensi kami

Memahami loop multi-agen

Optimalkan performa model dengan prompting

Prompt sistem

Tindakan yang tersedia

Parameter tool

Aktifkan kemampuan thinking di model Claude 4 dan Claude Sonnet 3.7

Memperkuat penggunaan komputer dengan tool lain

Bangun lingkungan penggunaan komputer kustom

Implementasikan tool penggunaan komputer

Tangani error

Ikuti praktik terbaik implementasi

Memahami keterbatasan penggunaan komputer

Harga

Langkah selanjutnya

Implementasi referensi

Dokumentasi tool

Langkah pertama

Model & harga

Pelajari tentang Claude

Kemampuan

Alat

Model Context Protocol (MCP)

Kasus penggunaan

Rekayasa prompt

Uji & evaluasi

Perkuat pagar pengaman

Pusat Hukum

​Gambaran Umum

​Kompatibilitas model

​Pertimbangan keamanan

Implementasi referensi penggunaan komputer

​Mulai cepat

​Cara kerja penggunaan komputer

​Lingkungan komputasi

​Cara mengimplementasikan penggunaan komputer

​Mulai dengan implementasi referensi kami

​Memahami loop multi-agen

​Optimalkan performa model dengan prompting

​Prompt sistem

​Tindakan yang tersedia

​Parameter tool

​Aktifkan kemampuan thinking di model Claude 4 dan Claude Sonnet 3.7

​Memperkuat penggunaan komputer dengan tool lain

​Bangun lingkungan penggunaan komputer kustom

​Implementasikan tool penggunaan komputer

​Tangani error

​Ikuti praktik terbaik implementasi

​Memahami keterbatasan penggunaan komputer

​Harga

​Langkah selanjutnya

Implementasi referensi

Dokumentasi tool

Gambaran Umum

Kompatibilitas model

Pertimbangan keamanan

Mulai cepat

Cara kerja penggunaan komputer

Lingkungan komputasi

Cara mengimplementasikan penggunaan komputer

Mulai dengan implementasi referensi kami

Memahami loop multi-agen

Optimalkan performa model dengan prompting

Prompt sistem

Tindakan yang tersedia

Parameter tool

Aktifkan kemampuan thinking di model Claude 4 dan Claude Sonnet 3.7

Memperkuat penggunaan komputer dengan tool lain

Bangun lingkungan penggunaan komputer kustom

Implementasikan tool penggunaan komputer

Tangani error

Ikuti praktik terbaik implementasi

Memahami keterbatasan penggunaan komputer

Harga

Langkah selanjutnya