Panduan ini membahas proses menentukan pendekatan terbaik untuk membangun pengklasifikasi dengan Claude dan hal-hal penting dalam penerapan end-to-end pengklasifikasi Claude, mulai dari eksplorasi kasus penggunaan hingga integrasi back-end.

Kunjungi buku resep klasifikasi kami untuk melihat contoh implementasi klasifikasi menggunakan Claude.

Kapan menggunakan Claude untuk klasifikasi

Kapan Anda harus mempertimbangkan menggunakan LLM alih-alih pendekatan ML tradisional untuk tugas klasifikasi Anda? Berikut adalah beberapa indikator utama:

  1. Kelas berbasis aturan: Gunakan Claude ketika kelas didefinisikan oleh kondisi daripada contoh, karena dapat memahami aturan yang mendasarinya.
  2. Kelas yang berkembang: Claude beradaptasi dengan baik terhadap domain baru atau yang berubah dengan kelas yang muncul dan batas yang bergeser.
  3. Input tidak terstruktur: Claude dapat menangani volume besar input teks tidak terstruktur dengan panjang yang bervariasi.
  4. Contoh berlabel terbatas: Dengan kemampuan pembelajaran few-shot, Claude belajar secara akurat dari data pelatihan berlabel yang terbatas.
  5. Persyaratan Penalaran: Claude unggul dalam tugas klasifikasi yang memerlukan pemahaman semantik, konteks, dan penalaran tingkat tinggi.

Tetapkan kasus penggunaan klasifikasi Anda

Berikut adalah daftar tidak lengkap dari kasus penggunaan klasifikasi umum di mana Claude unggul berdasarkan industri.


Implementasikan Claude untuk klasifikasi

Tiga faktor keputusan model utama adalah: kecerdasan, latensi, dan harga.

Untuk klasifikasi, model yang lebih kecil seperti Claude 3 Haiku biasanya ideal karena kecepatan dan efisiensinya. Meskipun, untuk tugas klasifikasi yang memerlukan pengetahuan khusus atau penalaran kompleks, Sonnet atau Opus mungkin pilihan yang lebih baik. Pelajari lebih lanjut tentang bagaimana Opus, Sonnet, dan Haiku dibandingkan di sini.

Gunakan evaluasi untuk mengukur apakah model Claude berkinerja cukup baik untuk diluncurkan ke produksi.

1. Bangun prompt input yang kuat

Meskipun Claude menawarkan kinerja dasar tingkat tinggi langsung dari kotak, prompt input yang kuat membantu mendapatkan hasil terbaik.

Untuk pengklasifikasi generik yang dapat Anda sesuaikan dengan kasus penggunaan spesifik Anda, salin prompt awal di bawah ini:

Kami juga menyediakan berbagai prompt untuk memulai dalam perpustakaan prompt kami, termasuk prompt untuk sejumlah kasus penggunaan klasifikasi, termasuk:

Analisis Sentimen

Deteksi nada dan sentimen di balik tweet. Pahami emosi, pendapat, dan reaksi pengguna secara real-time.

2. Kembangkan kasus uji Anda

Untuk menjalankan evaluasi klasifikasi Anda, Anda akan memerlukan kasus uji untuk menjalankannya. Lihat panduan kami untuk mengembangkan kasus uji.

3. Jalankan evaluasi Anda

Metrik evaluasi

Beberapa metrik keberhasilan yang perlu dipertimbangkan untuk mengevaluasi kinerja Claude pada tugas klasifikasi meliputi:

KriteriaDeskripsi
AkurasiOutput model cocok persis dengan jawaban emas atau mengklasifikasikan input dengan benar sesuai dengan persyaratan tugas. Ini biasanya dihitung sebagai (Jumlah prediksi yang benar) / (Jumlah keseluruhan prediksi).
Skor F1Output model menyeimbangkan presisi dan recall secara optimal.
KonsistensiOutput model konsisten dengan prediksinya untuk input serupa atau mengikuti pola logis.
StrukturOutput model mengikuti format atau struktur yang diharapkan, membuatnya mudah untuk diurai dan diinterpretasikan. Misalnya, banyak pengklasifikasi diharapkan menghasilkan format JSON.
KecepatanModel memberikan respons dalam batas waktu yang dapat diterima atau ambang latensi untuk tugas tersebut.
Bias dan KeadilanJika mengklasifikasikan data tentang orang, penting bahwa model tidak menunjukkan bias berdasarkan jenis kelamin, etnis, atau karakteristik lain yang akan menyebabkan kesalahan klasifikasi.

Terapkan pengklasifikasi Anda

Untuk melihat contoh kode tentang cara menggunakan Claude untuk klasifikasi, lihat Panduan Klasifikasi di Anthropic Cookbook.