Penggunaan komputer (beta)

Claude 4 Opus dan Sonnet, bersama dengan Claude Sonnet 3.7 dan Claude Sonnet 3.5 (baru), mampu berinteraksi dengan alat yang dapat memanipulasi lingkungan desktop komputer. Model Claude 4 menggunakan versi alat yang diperbarui yang dioptimalkan untuk arsitektur baru. Claude Sonnet 3.7 memperkenalkan alat tambahan dan memungkinkan Anda mengaktifkan pemikiran, memberi Anda wawasan lebih dalam tentang proses penalaran model.

Penggunaan komputer adalah fitur beta. Harap perhatikan bahwa penggunaan komputer menimbulkan risiko unik yang berbeda dari fitur API standar atau antarmuka obrolan. Risiko ini meningkat saat menggunakan fitur penggunaan komputer untuk berinteraksi dengan internet. Untuk meminimalkan risiko, pertimbangkan untuk mengambil tindakan pencegahan seperti:

Gunakan mesin virtual atau kontainer khusus dengan hak istimewa minimal untuk mencegah serangan sistem langsung atau kecelakaan.
Hindari memberikan model akses ke data sensitif, seperti informasi login akun, untuk mencegah pencurian informasi.
Batasi akses internet ke daftar domain yang diizinkan untuk mengurangi paparan konten berbahaya.
Minta manusia untuk mengonfirmasi keputusan yang dapat mengakibatkan konsekuensi dunia nyata yang berarti serta tugas apa pun yang memerlukan persetujuan afirmatif, seperti menerima cookie, melaksanakan transaksi keuangan, atau menyetujui persyaratan layanan.

Dalam beberapa keadaan, Claude akan mengikuti perintah yang ditemukan dalam konten bahkan jika bertentangan dengan instruksi pengguna. Misalnya, instruksi Claude di halaman web atau yang terdapat dalam gambar dapat mengesampingkan instruksi atau menyebabkan Claude membuat kesalahan. Kami menyarankan untuk mengambil tindakan pencegahan untuk mengisolasi Claude dari data dan tindakan sensitif guna menghindari risiko terkait injeksi prompt.

Kami telah melatih model untuk menolak injeksi prompt ini dan telah menambahkan lapisan pertahanan ekstra. Jika Anda menggunakan alat penggunaan komputer kami, kami akan secara otomatis menjalankan pengklasifikasi pada prompt Anda untuk menandai potensi contoh injeksi prompt. Ketika pengklasifikasi ini mengidentifikasi potensi injeksi prompt dalam tangkapan layar, mereka akan secara otomatis mengarahkan model untuk meminta konfirmasi pengguna sebelum melanjutkan dengan tindakan berikutnya. Kami menyadari bahwa perlindungan ekstra ini tidak akan ideal untuk setiap kasus penggunaan (misalnya, kasus penggunaan tanpa manusia dalam loop), jadi jika Anda ingin memilih keluar dan mematikannya, silakan hubungi kami.

Kami tetap menyarankan untuk mengambil tindakan pencegahan untuk mengisolasi Claude dari data dan tindakan sensitif guna menghindari risiko terkait injeksi prompt.

Terakhir, harap informasikan pengguna akhir tentang risiko yang relevan dan dapatkan persetujuan mereka sebelum mengaktifkan penggunaan komputer dalam produk Anda sendiri.

Implementasi referensi penggunaan komputer

Mulai dengan cepat menggunakan implementasi referensi penggunaan komputer kami yang mencakup antarmuka web, kontainer Docker, implementasi alat contoh, dan loop agen.

Catatan: Implementasi telah diperbarui untuk menyertakan alat baru untuk Claude 4 dan Claude Sonnet 3.7. Pastikan untuk menarik versi terbaru dari repo untuk mengakses fitur baru ini.

Silakan gunakan formulir ini untuk memberikan umpan balik tentang kualitas respons model, API itu sendiri, atau kualitas dokumentasi - kami tidak sabar untuk mendengar dari Anda!

Berikut adalah contoh cara menyediakan alat penggunaan komputer untuk Claude menggunakan API Messages:

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: computer-use-2025-01-24" \
  -d '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 1024,
    "tools": [
      {
        "type": "computer_20250124",
        "name": "computer",
        "display_width_px": 1024,
        "display_height_px": 768,
        "display_number": 1
      },
      {
        "type": "text_editor_20250429",
        "name": "str_replace_based_edit_tool"
      },
      {
        "type": "bash_20250124",
        "name": "bash"
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Save a picture of a cat to my desktop."
      }
    ],
    "thinking": {
      "type": "enabled",
      "budget_tokens": 1024
    }
  }'

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: computer-use-2025-01-24" \
  -d '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 1024,
    "tools": [
      {
        "type": "computer_20250124",
        "name": "computer",
        "display_width_px": 1024,
        "display_height_px": 768,
        "display_number": 1
      },
      {
        "type": "text_editor_20250429",
        "name": "str_replace_based_edit_tool"
      },
      {
        "type": "bash_20250124",
        "name": "bash"
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Save a picture of a cat to my desktop."
      }
    ],
    "thinking": {
      "type": "enabled",
      "budget_tokens": 1024
    }
  }'

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: computer-use-2025-01-24" \
  -d '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "tools": [
      {
        "type": "computer_20250124",
        "name": "computer",
        "display_width_px": 1024,
        "display_height_px": 768,
        "display_number": 1
      },
      {
        "type": "text_editor_20250124",
        "name": "str_replace_editor"
      },
      {
        "type": "bash_20250124",
        "name": "bash"
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Save a picture of a cat to my desktop."
      }
    ],
    "thinking": {
      "type": "enabled",
      "budget_tokens": 1024
    }
  }'

Cara kerja penggunaan komputer

1. Berikan Claude alat penggunaan komputer dan prompt pengguna

Tambahkan alat penggunaan komputer yang ditentukan Anthropic ke permintaan API Anda.
Sertakan prompt pengguna yang mungkin memerlukan alat ini, misalnya, “Simpan gambar kucing ke desktop saya.”

2. Claude memutuskan untuk menggunakan alat

Claude memuat definisi alat penggunaan komputer yang tersimpan dan menilai apakah ada alat yang dapat membantu kueri pengguna.
Jika ya, Claude membuat permintaan penggunaan alat yang diformat dengan benar.
Respons API memiliki stop_reason berupa tool_use, yang menandakan maksud Claude.

3. Ekstrak input alat, evaluasi alat pada komputer, dan kembalikan hasilnya

Di pihak Anda, ekstrak nama alat dan input dari permintaan Claude.
Gunakan alat pada kontainer atau Mesin Virtual.
Lanjutkan percakapan dengan pesan user baru yang berisi blok konten tool_result.

4. Claude terus memanggil alat penggunaan komputer sampai menyelesaikan tugas

Claude menganalisis hasil alat untuk menentukan apakah diperlukan penggunaan alat lebih lanjut atau tugas telah selesai.
Jika Claude memutuskan bahwa ia membutuhkan alat lain, ia merespons dengan stop_reason tool_use lain dan Anda harus kembali ke langkah 3.
Jika tidak, Claude membuat respons teks untuk pengguna.

Kami menyebut pengulangan langkah 3 dan 4 tanpa input pengguna sebagai “loop agen” - yaitu, Claude merespons dengan permintaan penggunaan alat dan aplikasi Anda merespons Claude dengan hasil evaluasi permintaan tersebut.

Lingkungan komputasi

Penggunaan komputer memerlukan lingkungan komputasi yang terisolasi di mana Claude dapat berinteraksi dengan aplikasi dan web dengan aman. Lingkungan ini mencakup:

Tampilan virtual: Server tampilan X11 virtual (menggunakan Xvfb) yang merender antarmuka desktop yang akan dilihat Claude melalui tangkapan layar dan dikontrol dengan tindakan mouse/keyboard.
Lingkungan desktop: UI ringan dengan pengelola jendela (Mutter) dan panel (Tint2) yang berjalan di Linux, yang menyediakan antarmuka grafis yang konsisten untuk interaksi Claude.
Aplikasi: Aplikasi Linux yang telah diinstal sebelumnya seperti Firefox, LibreOffice, editor teks, dan pengelola file yang dapat digunakan Claude untuk menyelesaikan tugas.
Implementasi alat: Kode integrasi yang menerjemahkan permintaan alat abstrak Claude (seperti “gerakkan mouse” atau “ambil tangkapan layar”) menjadi operasi aktual di lingkungan virtual.
Loop agen: Program yang menangani komunikasi antara Claude dan lingkungan, mengirimkan tindakan Claude ke lingkungan dan mengembalikan hasilnya (tangkapan layar, output perintah) kembali ke Claude.

Ketika Anda menggunakan fitur penggunaan komputer, Claude tidak terhubung langsung ke lingkungan ini. Sebaliknya, aplikasi Anda:

Menerima permintaan penggunaan alat Claude
Menerjemahkannya menjadi tindakan di lingkungan komputasi Anda
Menangkap hasilnya (tangkapan layar, output perintah, dll.)
Mengembalikan hasil ini ke Claude

Untuk keamanan dan isolasi, implementasi referensi menjalankan semua ini di dalam kontainer Docker dengan pemetaan port yang sesuai untuk melihat dan berinteraksi dengan lingkungan.

Cara mengimplementasikan penggunaan komputer

Mulai dengan implementasi referensi kami

Kami telah membangun implementasi referensi yang mencakup semua yang Anda butuhkan untuk memulai dengan cepat dengan penggunaan komputer:

Lingkungan dalam kontainer yang cocok untuk penggunaan komputer dengan Claude
Implementasi alat penggunaan komputer
Loop agen yang berinteraksi dengan API Anthropic dan mengeksekusi alat penggunaan komputer
Antarmuka web untuk berinteraksi dengan kontainer, loop agen, dan alat.

Memahami loop multi-agen

Inti dari penggunaan komputer adalah “loop agen” - siklus di mana Claude meminta tindakan alat, aplikasi Anda mengeksekusinya, dan mengembalikan hasil ke Claude. Berikut adalah contoh yang disederhanakan:

async def sampling_loop(
    *,
    model: str,
    messages: list[dict],
    api_key: str,
    max_tokens: int = 4096,
    tool_version: str,
    thinking_budget: int | None = None,
    max_iterations: int = 10,  # Tambahkan batas iterasi untuk mencegah loop tak terbatas
):
    """
    Loop agen sederhana untuk interaksi penggunaan komputer Claude.

    Fungsi ini menangani bolak-balik antara:
    1. Mengirim pesan pengguna ke Claude
    2. Claude meminta untuk menggunakan alat
    3. Aplikasi Anda mengeksekusi alat tersebut
    4. Mengirim hasil alat kembali ke Claude
    """
    # Siapkan alat dan parameter API
    client = Anthropic(api_key=api_key)
    beta_flag = "computer-use-2025-01-24" if "20250124" in tool_version else "computer-use-2024-10-22"

    # Konfigurasi alat - Anda seharusnya sudah menginisialisasi ini di tempat lain
    tools = [
        {"type": f"computer_{tool_version}", "name": "computer", "display_width_px": 1024, "display_height_px": 768},
        {"type": f"text_editor_{tool_version}", "name": "str_replace_editor"},
        {"type": f"bash_{tool_version}", "name": "bash"}
    ]

    # Loop agen utama (dengan batas iterasi untuk mencegah biaya API yang tidak terkendali)
    iterations = 0
    while True and iterations < max_iterations:
        iterations += 1
        # Siapkan parameter thinking opsional (untuk Claude Sonnet 3.7)
        thinking = None
        if thinking_budget:
            thinking = {"type": "enabled", "budget_tokens": thinking_budget}

        # Panggil API Claude
        response = client.beta.messages.create(
            model=model,
            max_tokens=max_tokens,
            messages=messages,
            tools=tools,
            betas=[beta_flag],
            thinking=thinking
        )

        # Tambahkan respons Claude ke riwayat percakapan
        response_content = response.content
        messages.append({"role": "assistant", "content": response_content})

        # Periksa apakah Claude menggunakan alat apa pun
        tool_results = []
        for block in response_content:
            if block.type == "tool_use":
                # Dalam aplikasi nyata, Anda akan mengeksekusi alat di sini
                # Misalnya: result = run_tool(block.name, block.input)
                result = {"result": "Tool executed successfully"}

                # Format hasil untuk Claude
                tool_results.append({
                    "type": "tool_result",
                    "tool_use_id": block.id,
                    "content": result
                })

        # Jika tidak ada alat yang digunakan, Claude sudah selesai - kembalikan pesan akhir
        if not tool_results:
            return messages

        # Tambahkan hasil alat ke pesan untuk iterasi berikutnya dengan Claude
        messages.append({"role": "user", "content": tool_results})

Loop berlanjut sampai Claude merespons tanpa meminta alat apa pun (penyelesaian tugas) atau batas iterasi maksimum tercapai. Pengaman ini mencegah potensi loop tak terbatas yang dapat mengakibatkan biaya API yang tidak terduga.

Untuk setiap versi alat, Anda harus menggunakan flag beta yang sesuai dalam permintaan API Anda:

Flag beta Claude 4

Flag beta Claude Sonnet 3.7

Flag beta Claude Sonnet 3.5 (baru)

Kami merekomendasikan untuk mencoba implementasi referensi sebelum membaca sisa dokumentasi ini.

Optimalkan kinerja model dengan prompting

Berikut adalah beberapa tips tentang cara mendapatkan output berkualitas terbaik:

Tentukan tugas sederhana dan terdefinisi dengan baik serta berikan instruksi eksplisit untuk setiap langkah.
Claude terkadang mengasumsikan hasil dari tindakannya tanpa secara eksplisit memeriksa hasilnya. Untuk mencegah hal ini, Anda dapat memberikan prompt kepada Claude dengan Setelah setiap langkah, ambil tangkapan layar dan evaluasi dengan cermat apakah Anda telah mencapai hasil yang benar. Tunjukkan pemikiran Anda secara eksplisit: "Saya telah mengevaluasi langkah X..." Jika tidak benar, coba lagi. Hanya ketika Anda mengonfirmasi bahwa suatu langkah telah dieksekusi dengan benar, Anda boleh melanjutkan ke langkah berikutnya.
Beberapa elemen UI (seperti dropdown dan scrollbar) mungkin sulit dimanipulasi oleh Claude menggunakan gerakan mouse. Jika Anda mengalami hal ini, coba berikan prompt kepada model untuk menggunakan pintasan keyboard.
Untuk tugas berulang atau interaksi UI, sertakan tangkapan layar contoh dan panggilan alat dari hasil yang berhasil dalam prompt Anda.
Jika Anda memerlukan model untuk masuk, berikan nama pengguna dan kata sandi dalam prompt Anda di dalam tag xml seperti <robot_credentials>. Menggunakan penggunaan komputer dalam aplikasi yang memerlukan login meningkatkan risiko hasil buruk akibat injeksi prompt. Harap tinjau panduan kami tentang mitigasi injeksi prompt sebelum memberikan kredensial login kepada model.

Jika Anda berulang kali mengalami serangkaian masalah yang jelas atau mengetahui sebelumnya tugas-tugas yang perlu diselesaikan Claude, gunakan prompt sistem untuk memberikan Claude tips atau instruksi eksplisit tentang cara melakukan tugas dengan sukses.

Prompt sistem

Ketika salah satu alat yang ditentukan Anthropic diminta melalui API Anthropic, prompt sistem khusus penggunaan komputer dibuat. Ini mirip dengan prompt sistem penggunaan alat tetapi dimulai dengan:

Anda memiliki akses ke serangkaian fungsi yang dapat Anda gunakan untuk menjawab pertanyaan pengguna. Ini termasuk akses ke lingkungan komputasi yang terisolasi. Anda TIDAK saat ini memiliki kemampuan untuk memeriksa file atau berinteraksi dengan sumber daya eksternal, kecuali dengan memanggil fungsi di bawah ini.

Seperti halnya penggunaan alat biasa, bidang system_prompt yang disediakan pengguna tetap dihormati dan digunakan dalam konstruksi prompt sistem gabungan.

Memahami alat yang ditentukan Anthropic

Sebagai beta, definisi alat ini dapat berubah.

Kami telah menyediakan serangkaian alat yang memungkinkan Claude menggunakan komputer secara efektif. Saat menentukan alat yang ditentukan Anthropic, bidang description dan tool_schema tidak diperlukan atau diizinkan.

Alat yang ditentukan Anthropic dieksekusi oleh pengguna

Alat yang ditentukan Anthropic didefinisikan oleh Anthropic tetapi Anda harus secara eksplisit mengevaluasi hasil alat dan mengembalikan tool_results ke Claude. Seperti halnya alat lain, model tidak secara otomatis mengeksekusi alat.

Kami menyediakan serangkaian alat yang ditentukan Anthropic, dengan setiap alat memiliki versi yang dioptimalkan untuk Claude 4, Claude Sonnet 3.7, dan Claude Sonnet 3.5:

Alat Claude 4

Alat Claude Sonnet 3.7

Alat Claude Sonnet 3.5 (baru)

Bidang type mengidentifikasi alat dan parameternya untuk tujuan validasi, bidang name adalah nama alat yang diekspos ke model.

Jika Anda ingin memberikan prompt kepada model untuk menggunakan salah satu alat ini, Anda dapat secara eksplisit merujuk alat dengan bidang name. Bidang name harus unik dalam daftar alat; Anda tidak dapat mendefinisikan alat dengan nama yang sama dengan alat yang ditentukan Anthropic dalam panggilan API yang sama.

Kami tidak merekomendasikan mendefinisikan alat dengan nama alat yang ditentukan Anthropic. Meskipun Anda masih dapat mendefinisikan ulang alat dengan nama-nama ini (selama nama alat unik dalam blok tools Anda), melakukan hal ini dapat mengakibatkan penurunan kinerja model.

Alat komputer

Kami tidak merekomendasikan mengirim tangkapan layar dalam resolusi di atas XGA/WXGA untuk menghindari masalah terkait pengubahan ukuran gambar. Mengandalkan perilaku pengubahan ukuran gambar di API akan menghasilkan akurasi model yang lebih rendah dan kinerja yang lebih lambat daripada mengimplementasikan penskalaan sendiri secara langsung.

Repositori referensi menunjukkan cara menskalakan dari resolusi yang lebih tinggi ke resolusi yang disarankan.

Tipe

computer_20250124 - Alat komputer yang ditingkatkan dengan fitur canggih untuk Claude 4
computer_20250124 - Alat komputer yang ditingkatkan dengan tindakan tambahan yang tersedia di Claude Sonnet 3.7
computer_20241022 - Alat komputer asli yang digunakan dengan Claude Sonnet 3.5 (baru)

Parameter

display_width_px: Wajib Lebar tampilan yang dikendalikan oleh model dalam piksel.
display_height_px: Wajib Tinggi tampilan yang dikendalikan oleh model dalam piksel.
display_number: Opsional Nomor tampilan yang akan dikendalikan (hanya relevan untuk lingkungan X11). Jika ditentukan, alat akan diberikan nomor tampilan dalam definisi alat.

Deskripsi alat

Kami menyediakan deskripsi alat kami hanya untuk referensi. Anda tidak boleh menentukan ini dalam panggilan alat yang ditentukan Anthropic Anda.

Gunakan mouse dan keyboard untuk berinteraksi dengan komputer, dan ambil tangkapan layar.
* Ini adalah antarmuka ke GUI desktop. Anda tidak memiliki akses ke terminal atau menu aplikasi. Anda harus mengklik ikon desktop untuk memulai aplikasi.
* Beberapa aplikasi mungkin memerlukan waktu untuk memulai atau memproses tindakan, jadi Anda mungkin perlu menunggu dan mengambil tangkapan layar berturut-turut untuk melihat hasil tindakan Anda. Misalnya, jika Anda mengklik Firefox dan jendela tidak terbuka, coba ambil tangkapan layar lain.
* Resolusi layar adalah {{ display_width_px }}x{{ display_height_px }}.
* Nomor tampilan adalah {{ display_number }}
* Setiap kali Anda bermaksud memindahkan kursor untuk mengklik elemen seperti ikon, Anda harus melihat tangkapan layar untuk menentukan koordinat elemen sebelum memindahkan kursor.
* Jika Anda mencoba mengklik program atau tautan tetapi gagal dimuat, bahkan setelah menunggu, coba sesuaikan posisi kursor Anda sehingga ujung kursor secara visual jatuh pada elemen yang ingin Anda klik.
* Pastikan untuk mengklik tombol, tautan, ikon, dll. dengan ujung kursor di tengah elemen. Jangan mengklik kotak di tepinya kecuali diminta.

Skema input alat

Kami menyediakan skema input kami hanya untuk referensi. Untuk alat computer_20250124 yang ditingkatkan yang tersedia dengan Claude Sonnet 3.7. Berikut adalah skema input lengkapnya:

{
    "properties": {
        "action": {
            "description": "Tindakan yang akan dilakukan. Tindakan yang tersedia adalah:\n"
            "* `key`: Tekan tombol atau kombinasi tombol pada keyboard.\n"
            "  - Ini mendukung sintaks `key` xdotool.\n"
            '  - Contoh: "a", "Return", "alt+Tab", "ctrl+s", "Up", "KP_0" (untuk tombol numpad 0).\n'
            "* `hold_key`: Tahan tombol atau beberapa tombol selama durasi tertentu (dalam detik). Mendukung sintaks yang sama dengan `key`.\n"
            "* `type`: Ketik string teks pada keyboard.\n"
            "* `cursor_position`: Dapatkan koordinat piksel (x, y) saat ini dari kursor pada layar.\n"
            "* `mouse_move`: Pindahkan kursor ke koordinat piksel (x, y) tertentu pada layar.\n"
            "* `left_mouse_down`: Tekan tombol mouse kiri.\n"
            "* `left_mouse_up`: Lepaskan tombol mouse kiri.\n"
            "* `left_click`: Klik tombol mouse kiri pada koordinat piksel (x, y) tertentu pada layar. Anda juga dapat menyertakan kombinasi tombol untuk ditahan saat mengklik menggunakan parameter `text`.\n"
            "* `left_click_drag`: Klik dan seret kursor dari `start_coordinate` ke koordinat piksel (x, y) tertentu pada layar.\n"
            "* `right_click`: Klik tombol mouse kanan pada koordinat piksel (x, y) tertentu pada layar.\n"
            "* `middle_click`: Klik tombol mouse tengah pada koordinat piksel (x, y) tertentu pada layar.\n"
            "* `double_click`: Klik ganda tombol mouse kiri pada koordinat piksel (x, y) tertentu pada layar.\n"
            "* `triple_click`: Klik tiga kali tombol mouse kiri pada koordinat piksel (x, y) tertentu pada layar.\n"
            "* `scroll`: Gulir layar dalam arah tertentu dengan jumlah klik roda gulir tertentu, pada koordinat piksel (x, y) tertentu. JANGAN gunakan PageUp/PageDown untuk menggulir.\n"
            "* `wait`: Tunggu selama durasi tertentu (dalam detik).\n"
            "* `screenshot`: Ambil tangkapan layar dari layar.",
            "enum": [
                "key",
                "hold_key",
                "type",
                "cursor_position",
                "mouse_move",
                "left_mouse_down",
                "left_mouse_up",
                "left_click",
                "left_click_drag",
                "right_click",
                "middle_click",
                "double_click",
                "triple_click",
                "scroll",
                "wait",
                "screenshot",
            ],
            "type": "string",
        },
        "coordinate": {
            "description": "(x, y): Koordinat x (piksel dari tepi kiri) dan y (piksel dari tepi atas) untuk memindahkan mouse. Diperlukan hanya oleh `action=mouse_move` dan `action=left_click_drag`.",
            "type": "array",
        },
        "duration": {
            "description": "Durasi untuk menahan tombol. Diperlukan hanya oleh `action=hold_key` dan `action=wait`.",
            "type": "integer",
        },
        "scroll_amount": {
            "description": "Jumlah 'klik' untuk menggulir. Diperlukan hanya oleh `action=scroll`.",
            "type": "integer",
        },
        "scroll_direction": {
            "description": "Arah untuk menggulir layar. Diperlukan hanya oleh `action=scroll`.",
            "enum": ["up", "down", "left", "right"],
            "type": "string",
        },
        "start_coordinate": {
            "description": "(x, y): Koordinat x (piksel dari tepi kiri) dan y (piksel dari tepi atas) untuk memulai seret. Diperlukan hanya oleh `action=left_click_drag`.",
            "type": "array",
        },
        "text": {
            "description": "Diperlukan hanya oleh `action=type`, `action=key`, dan `action=hold_key`. Juga dapat digunakan oleh tindakan klik atau gulir untuk menahan tombol saat mengklik atau menggulir.",
            "type": "string",
        },
    },
    "required": ["action"],
    "type": "object",
}

Untuk alat computer_20241022 asli yang digunakan dengan Claude Sonnet 3.5 (baru):

{
    "properties": {
        "action": {
            "description": """Tindakan yang akan dilakukan. Tindakan yang tersedia adalah:
                * `key`: Tekan tombol atau kombinasi tombol pada keyboard.
                  - Ini mendukung sintaks `key` xdotool.
                  - Contoh: "a", "Return", "alt+Tab", "ctrl+s", "Up", "KP_0" (untuk tombol numpad 0).
                * `type`: Ketik string teks pada keyboard.
                * `cursor_position`: Dapatkan koordinat piksel (x, y) saat ini dari kursor pada layar.
                * `mouse_move`: Pindahkan kursor ke koordinat piksel (x, y) tertentu pada layar.
                * `left_click`: Klik tombol mouse kiri.
                * `left_click_drag`: Klik dan seret kursor ke koordinat piksel (x, y) tertentu pada layar.
                * `right_click`: Klik tombol mouse kanan.
                * `middle_click`: Klik tombol mouse tengah.
                * `double_click`: Klik ganda tombol mouse kiri.
                * `screenshot`: Ambil tangkapan layar dari layar.""",
            "enum": [
                "key",
                "type",
                "mouse_move",
                "left_click",
                "left_click_drag",
                "right_click",
                "middle_click",
                "double_click",
                "screenshot",
                "cursor_position",
            ],
            "type": "string",
        },
        "coordinate": {
            "description": "(x, y): Koordinat x (piksel dari tepi kiri) dan y (piksel dari tepi atas) untuk memindahkan mouse. Diperlukan hanya oleh `action=mouse_move` dan `action=left_click_drag`.",
            "type": "array",
        },
        "text": {
            "description": "Diperlukan hanya oleh `action=type` dan `action=key`.",
            "type": "string",
        },
    },
    "required": ["action"],
    "type": "object",
}

Alat editor teks

Tipe

text_editor_20250429 - Editor teks yang diperbarui untuk Claude 4 tanpa perintah undo_edit
text_editor_20250124 - Kemampuan yang sama dengan versi 20241022, untuk digunakan dengan Claude Sonnet 3.7
text_editor_20241022 - Alat editor teks asli yang digunakan dengan Claude Sonnet 3.5 (baru)

Deskripsi alat

Kami menyediakan deskripsi alat kami hanya untuk referensi. Anda tidak boleh menentukan ini dalam panggilan alat yang ditentukan Anthropic Anda.

Alat pengeditan kustom untuk melihat, membuat, dan mengedit file
* Status bertahan di seluruh panggilan perintah dan diskusi dengan pengguna
* Jika `path` adalah file, `view` menampilkan hasil dari menerapkan `cat -n`. Jika `path` adalah direktori, `view` mencantumkan file dan direktori yang tidak tersembunyi hingga 2 level mendalam
* Perintah `create` tidak dapat digunakan jika `path` yang ditentukan sudah ada sebagai file
* Jika `command` menghasilkan output yang panjang, itu akan dipotong dan ditandai dengan `<response clipped>`
* Perintah `undo_edit` akan mengembalikan edit terakhir yang dibuat ke file di `path` (tidak tersedia di text_editor_20250429)

Catatan untuk menggunakan perintah `str_replace`:
* Parameter `old_str` harus cocok PERSIS dengan satu atau lebih baris berurutan dari file asli. Perhatikan spasi!
* Jika parameter `old_str` tidak unik dalam file, penggantian tidak akan dilakukan. Pastikan untuk menyertakan konteks yang cukup di `old_str` untuk membuatnya unik
* Parameter `new_str` harus berisi baris yang diedit yang harus menggantikan `old_str`

Skema input alat

Kami menyediakan skema input kami hanya untuk referensi. Anda tidak boleh menentukan ini dalam panggilan alat yang ditentukan Anthropic Anda.

{
    "properties": {
        "command": {
            "description": "Perintah yang akan dijalankan. Opsi yang diizinkan adalah: `view`, `create`, `str_replace`, `insert`, `undo_edit`.",
            "enum": ["view", "create", "str_replace", "insert", "undo_edit"],
            "type": "string",
        },
        "file_text": {
            "description": "Parameter wajib dari perintah `create`, dengan konten file yang akan dibuat.",
            "type": "string",
        },
        "insert_line": {
            "description": "Parameter wajib dari perintah `insert`. `new_str` akan disisipkan SETELAH baris `insert_line` dari `path`.",
            "type": "integer",
        },
        "new_str": {
            "description": "Parameter opsional dari perintah `str_replace` yang berisi string baru (jika tidak diberikan, tidak ada string yang akan ditambahkan). Parameter wajib dari perintah `insert` yang berisi string yang akan disisipkan.",
            "type": "string",
        },
        "old_str": {
            "description": "Parameter wajib dari perintah `str_replace` yang berisi string di `path` untuk diganti.",
            "type": "string",
        },
        "path": {
            "description": "Path absolut ke file atau direktori, misalnya `/repo/file.py` atau `/repo`.",
            "type": "string",
        },
        "view_range": {
            "description": "Parameter opsional dari perintah `view` ketika `path` menunjuk ke file. Jika tidak ada yang diberikan, file lengkap akan ditampilkan. Jika disediakan, file akan ditampilkan dalam rentang nomor baris yang ditunjukkan, misalnya [11, 12] akan menampilkan baris 11 dan 12. Pengindeksan di 1 untuk memulai. Pengaturan `[start_line, -1]` menampilkan semua baris dari `start_line` hingga akhir file.",
            "items": {"type": "integer"},
            "type": "array",
        },
    },
    "required": ["command", "path"],
    "type": "object",
}

Alat Bash

Tipe

bash_20250124 - Alat bash yang ditingkatkan untuk Claude 4 dengan kemampuan yang lebih baik
bash_20250124 - Kemampuan yang sama dengan versi 20241022, untuk digunakan dengan Claude Sonnet 3.7
bash_20241022 - Alat bash asli yang digunakan dengan Claude Sonnet 3.5 (baru)

Deskripsi alat

Kami menyediakan deskripsi alat kami hanya untuk referensi. Anda tidak boleh menentukan ini dalam panggilan alat yang ditentukan Anthropic Anda.

Jalankan perintah di shell bash
* Saat memanggil alat ini, isi parameter "command" TIDAK perlu di-XML-escape.
* Anda memiliki akses ke cermin paket linux dan python umum melalui apt dan pip.
* Status bertahan di seluruh panggilan perintah dan diskusi dengan pengguna.
* Untuk memeriksa rentang baris tertentu dari file, misalnya baris 10-25, coba 'sed -n 10,25p /path/to/the/file'.
* Harap hindari perintah yang mungkin menghasilkan output dalam jumlah yang sangat besar.
* Harap jalankan perintah yang berjalan lama di latar belakang, misalnya 'sleep 10 &' atau mulai server di latar belakang.

Skema input alat

Kami menyediakan skema input kami hanya untuk referensi. Anda tidak boleh menentukan ini dalam panggilan alat yang ditentukan Anthropic Anda.

{
    "properties": {
        "command": {
            "description": "Perintah bash yang akan dijalankan. Diperlukan kecuali alat sedang dimulai ulang.",
            "type": "string",
        },
        "restart": {
            "description": "Menentukan true akan memulai ulang alat ini. Jika tidak, biarkan ini tidak ditentukan.",
            "type": "boolean",
        },
    }
}

Aktifkan kemampuan berpikir di Claude 4 dan Claude Sonnet 3.7

Claude Sonnet 3.7 memperkenalkan kemampuan “berpikir” baru yang memungkinkan Anda melihat proses penalaran model saat mengerjakan tugas kompleks. Fitur ini membantu Anda memahami bagaimana Claude mendekati masalah dan dapat sangat berharga untuk debugging atau tujuan pendidikan.

Untuk mengaktifkan pemikiran, tambahkan parameter thinking ke permintaan API Anda:

"thinking": {
  "type": "enabled",
  "budget_tokens": 1024
}

Parameter budget_tokens menentukan berapa banyak token yang dapat digunakan Claude untuk berpikir. Ini dikurangi dari anggaran max_tokens Anda secara keseluruhan.

Ketika pemikiran diaktifkan, Claude akan mengembalikan proses penalarannya sebagai bagian dari respons, yang dapat membantu Anda:

Memahami proses pengambilan keputusan model
Mengidentifikasi potensi masalah atau kesalahpahaman
Belajar dari pendekatan Claude untuk pemecahan masalah
Mendapatkan visibilitas lebih ke dalam operasi multi-langkah yang kompleks

Berikut adalah contoh seperti apa output pemikiran itu:

[Thinking]
Saya perlu menyimpan gambar kucing ke desktop. Mari saya uraikan ini menjadi langkah-langkah:

1. Pertama, saya akan mengambil tangkapan layar untuk melihat apa yang ada di desktop
2. Kemudian saya akan mencari browser web untuk mencari gambar kucing
3. Setelah menemukan gambar yang cocok, saya perlu menyimpannya ke desktop

Mari saya mulai dengan mengambil tangkapan layar untuk melihat apa yang tersedia...

Kombinasikan penggunaan komputer dengan alat lain

Anda dapat menggabungkan penggunaan alat biasa dengan alat yang ditentukan Anthropic untuk penggunaan komputer.

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: computer-use-2025-01-24" \
  -d '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 1024,
    "tools": [
      {
        "type": "computer_20250124",
        "name": "computer",
        "display_width_px": 1024,
        "display_height_px": 768,
        "display_number": 1
      },
      {
        "type": "text_editor_20250124",
        "name": "str_replace_editor"
      },
      {
        "type": "bash_20250124",
        "name": "bash"
      },
      {
        "name": "get_weather",
        "description": "Get the current weather in a given location",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "The city and state, e.g. San Francisco, CA"
            },
            "unit": {
              "type": "string",
              "enum": ["celsius", "fahrenheit"],
              "description": "The unit of temperature, either 'celsius' or 'fahrenheit'"
            }
          },
          "required": ["location"]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Find flights from San Francisco to a place with warmer weather."
      }
    ],
    "thinking": {
      "type": "enabled",
      "budget_tokens": 1024
    }
  }'

Bangun lingkungan penggunaan komputer kustom

Implementasi referensi dimaksudkan untuk membantu Anda memulai dengan penggunaan komputer. Ini mencakup semua komponen yang diperlukan agar Claude dapat menggunakan komputer. Namun, Anda dapat membangun lingkungan Anda sendiri untuk penggunaan komputer sesuai kebutuhan Anda. Anda akan memerlukan:

Lingkungan virtual atau dalam kontainer yang cocok untuk penggunaan komputer dengan Claude
Implementasi dari setidaknya satu alat penggunaan komputer yang ditentukan Anthropic
Loop agen yang berinteraksi dengan API Anthropic dan mengeksekusi hasil tool_use menggunakan implementasi alat Anda
API atau UI yang memungkinkan input pengguna untuk memulai loop agen

Memahami batasan penggunaan komputer

Fungsionalitas penggunaan komputer masih dalam tahap beta. Meskipun kemampuan Claude sangat canggih, pengembang harus menyadari keterbatasannya:

Latensi: latensi penggunaan komputer saat ini untuk interaksi manusia-AI mungkin terlalu lambat dibandingkan dengan tindakan komputer yang diarahkan manusia biasa. Kami merekomendasikan untuk fokus pada kasus penggunaan di mana kecepatan tidak penting (misalnya, pengumpulan informasi latar belakang, pengujian perangkat lunak otomatis) di lingkungan tepercaya.
Akurasi dan keandalan visi komputer: Claude mungkin membuat kesalahan atau berhalusinasi saat mengeluarkan koordinat spesifik saat menghasilkan tindakan. Claude Sonnet 3.7 memperkenalkan kemampuan berpikir yang dapat membantu Anda memahami penalaran model dan mengidentifikasi potensi masalah.
Akurasi dan keandalan pemilihan alat: Claude mungkin membuat kesalahan atau berhalusinasi saat memilih alat saat menghasilkan tindakan atau mengambil tindakan tak terduga untuk menyelesaikan masalah. Selain itu, keandalan mungkin lebih rendah saat berinteraksi dengan aplikasi khusus atau beberapa aplikasi sekaligus. Kami merekomendasikan agar pengguna memberikan prompt kepada model dengan hati-hati saat meminta tugas kompleks.
Keandalan pengguliran: Sementara Claude Sonnet 3.5 (baru) memiliki keterbatasan dengan pengguliran, Claude Sonnet 3.7 memperkenalkan tindakan gulir khusus dengan kontrol arah yang meningkatkan keandalan. Model sekarang dapat secara eksplisit menggulir ke segala arah (atas/bawah/kiri/kanan) dengan jumlah tertentu.
Interaksi spreadsheet: Klik mouse untuk interaksi spreadsheet telah ditingkatkan di Claude Sonnet 3.7 dengan penambahan tindakan kontrol mouse yang lebih presisi seperti left_mouse_down, left_mouse_up, dan dukungan tombol modifier baru. Pemilihan sel dapat lebih andal dengan menggunakan kontrol yang lebih terperinci ini dan menggabungkan tombol modifier dengan klik.
Pembuatan akun dan pembuatan konten di platform sosial dan komunikasi: Meskipun Claude akan mengunjungi situs web, kami membatasi kemampuannya untuk membuat akun atau menghasilkan dan berbagi konten atau terlibat dalam peniruan manusia di situs web dan platform media sosial. Kami mungkin memperbarui kemampuan ini di masa depan.
Kerentanan: Kerentanan seperti jailbreaking atau injeksi prompt mungkin tetap ada di seluruh sistem AI frontier, termasuk API penggunaan komputer beta. Dalam beberapa keadaan, Claude akan mengikuti perintah yang ditemukan dalam konten, terkadang bahkan bertentangan dengan instruksi pengguna. Misalnya, instruksi Claude di halaman web atau yang terdapat dalam gambar dapat mengesampingkan instruksi atau menyebabkan Claude membuat kesalahan. Kami merekomendasikan: a. Membatasi penggunaan komputer ke lingkungan tepercaya seperti mesin virtual atau kontainer dengan hak istimewa minimal b. Menghindari memberikan akses penggunaan komputer ke akun atau data sensitif tanpa pengawasan ketat c. Menginformasikan pengguna akhir tentang risiko yang relevan dan mendapatkan persetujuan mereka sebelum mengaktifkan atau meminta izin yang diperlukan untuk fitur penggunaan komputer dalam aplikasi Anda
Tindakan tidak pantas atau ilegal: Sesuai dengan ketentuan layanan Anthropic, Anda tidak boleh menggunakan penggunaan komputer untuk melanggar hukum atau Kebijakan Penggunaan yang Dapat Diterima kami.

Selalu tinjau dan verifikasi dengan cermat tindakan dan log penggunaan komputer Claude. Jangan gunakan Claude untuk tugas yang memerlukan presisi sempurna atau informasi pengguna sensitif tanpa pengawasan manusia.

Harga

Lihat dokumentasi harga penggunaan alat untuk penjelasan terperinci tentang bagaimana permintaan API Claude Tool Use dihargai.

Sebagai subset dari permintaan penggunaan alat, permintaan penggunaan komputer dihargai sama dengan permintaan API Claude lainnya.

Kami juga secara otomatis menyertakan prompt sistem khusus untuk model, yang memungkinkan penggunaan komputer.

Model	Pilihan alat	Jumlah token prompt sistem
Claude 4 Opus & Sonnet	`auto` `any`, `tool`	466 token 499 token
Claude Sonnet 3.7	`auto` `any`, `tool`	466 token 499 token
Claude Sonnet 3.5 (baru)	`auto` `any`, `tool`	466 token 499 token

Selain token dasar, token input tambahan berikut diperlukan untuk alat yang ditentukan Anthropic:

Alat	Token input tambahan
`computer_20250124` (Claude 4)	735 token
`computer_20250124` (Claude Sonnet 3.7)	735 token
`computer_20241022` (Claude Sonnet 3.5)	683 token
`text_editor_20250429` (Claude 4)	700 token
`text_editor_20250124` (Claude Sonnet 3.7)	700 token
`text_editor_20241022` (Claude Sonnet 3.5)	700 token
`bash_20250124` (Claude 4)	245 token
`bash_20250124` (Claude Sonnet 3.7)	245 token
`bash_20241022` (Claude Sonnet 3.5)	245 token

Jika Anda mengaktifkan pemikiran dengan Claude 4 atau Claude Sonnet 3.7, token yang digunakan untuk berpikir akan dihitung terhadap anggaran max_tokens Anda berdasarkan budget_tokens yang Anda tentukan dalam parameter pemikiran.

Release Notes

Implementasi referensi penggunaan komputer

​Cara kerja penggunaan komputer

​Lingkungan komputasi

​Cara mengimplementasikan penggunaan komputer

​Mulai dengan implementasi referensi kami

​Memahami loop multi-agen

​Optimalkan kinerja model dengan prompting

​Prompt sistem

​Memahami alat yang ditentukan Anthropic

​Aktifkan kemampuan berpikir di Claude 4 dan Claude Sonnet 3.7

​Kombinasikan penggunaan komputer dengan alat lain

​Bangun lingkungan penggunaan komputer kustom

​Memahami batasan penggunaan komputer

​Harga

Cara kerja penggunaan komputer

Lingkungan komputasi

Cara mengimplementasikan penggunaan komputer

Mulai dengan implementasi referensi kami

Memahami loop multi-agen

Optimalkan kinerja model dengan prompting

Prompt sistem

Memahami alat yang ditentukan Anthropic

Aktifkan kemampuan berpikir di Claude 4 dan Claude Sonnet 3.7

Kombinasikan penggunaan komputer dengan alat lain

Bangun lingkungan penggunaan komputer kustom

Memahami batasan penggunaan komputer

Harga