Peringkasan dokumen hukum
Panduan ini menjelaskan cara memanfaatkan kemampuan pemrosesan bahasa alami tingkat lanjut Claude untuk meringkas dokumen hukum secara efisien, mengekstrak informasi kunci dan mempercepat penelitian hukum. Dengan Claude, Anda dapat merampingkan peninjauan kontrak, persiapan litigasi, dan pekerjaan regulasi, menghemat waktu dan memastikan akurasi dalam proses hukum Anda.
Kunjungi panduan peringkasan kami untuk melihat contoh implementasi peringkasan dokumen hukum menggunakan Claude.
Sebelum membangun dengan Claude
Tentukan apakah menggunakan Claude untuk peringkasan dokumen hukum
Berikut adalah beberapa indikator kunci bahwa Anda sebaiknya menggunakan LLM seperti Claude untuk meringkas dokumen hukum:
Tentukan detail yang ingin Anda ekstrak dari peringkasan
Tidak ada ringkasan tunggal yang benar untuk setiap dokumen. Tanpa arahan yang jelas, Claude mungkin kesulitan menentukan detail mana yang harus disertakan. Untuk mencapai hasil optimal, identifikasi informasi spesifik yang ingin Anda sertakan dalam ringkasan.
Misalnya, saat meringkas perjanjian sewa-menyewa, Anda mungkin ingin mengekstrak poin-poin kunci berikut:
Tetapkan kriteria keberhasilan
Mengevaluasi kualitas ringkasan adalah tugas yang terkenal menantang. Tidak seperti banyak tugas pemrosesan bahasa alami lainnya, evaluasi ringkasan sering kali tidak memiliki metrik objektif yang jelas. Prosesnya bisa sangat subjektif, dengan pembaca yang berbeda menghargai aspek yang berbeda dari sebuah ringkasan. Berikut adalah kriteria yang mungkin ingin Anda pertimbangkan saat menilai seberapa baik Claude melakukan peringkasan hukum.
Lihat panduan kami tentang menetapkan kriteria keberhasilan untuk informasi lebih lanjut.
Cara meringkas dokumen hukum menggunakan Claude
Pilih model Claude yang tepat
Akurasi model sangat penting saat meringkas dokumen hukum. Claude 3.5 Sonnet adalah pilihan yang sangat baik untuk kasus penggunaan seperti ini di mana akurasi tinggi diperlukan. Jika ukuran dan kuantitas dokumen Anda besar sehingga biaya mulai menjadi perhatian, Anda juga dapat mencoba menggunakan model yang lebih kecil seperti Claude 3 Haiku.
Untuk membantu memperkirakan biaya ini, berikut adalah perbandingan biaya untuk meringkas 1.000 perjanjian sewa-menyewa menggunakan Sonnet dan Haiku:
-
Ukuran konten
- Jumlah perjanjian: 1.000
- Karakter per perjanjian: 300.000
- Total karakter: 300M
-
Perkiraan token
- Token input: 86M (asumsi 1 token per 3,5 karakter)
- Token output per ringkasan: 350
- Total token output: 350.000
-
Perkiraan biaya Claude 3.5 Sonnet
- Biaya token input: 86 MTok * 258
- Biaya token output: 0,35 MTok * 5,25
- Total biaya: 5,25 = $263,25
-
Perkiraan biaya Claude 3 Haiku
- Biaya token input: 86 MTok * 21,50
- Biaya token output: 0,35 MTok * 0,44
- Total biaya: 0,44 = $21,96
Ubah dokumen menjadi format yang dapat diproses Claude
Sebelum Anda mulai meringkas dokumen, Anda perlu menyiapkan data Anda. Ini melibatkan ekstraksi teks dari PDF, membersihkan teks, dan memastikan siap untuk diproses oleh Claude.
Berikut adalah demonstrasi proses ini pada contoh pdf:
Dalam contoh ini, pertama-tama kita mengunduh pdf dari contoh perjanjian sewa-menyewa yang digunakan dalam panduan peringkasan. Perjanjian ini bersumber dari perjanjian sewa-menyewa yang tersedia untuk umum dari situs web sec.gov.
Kita menggunakan library pypdf untuk mengekstrak isi pdf dan mengubahnya menjadi teks. Data teks kemudian dibersihkan dengan menghapus spasi berlebih dan nomor halaman.
Bangun prompt yang kuat
Claude dapat beradaptasi dengan berbagai gaya peringkasan. Anda dapat mengubah detail prompt untuk mengarahkan Claude agar lebih atau kurang bertele-tele, menyertakan lebih banyak atau sedikit terminologi teknis, atau memberikan ringkasan konteks pada tingkat yang lebih tinggi atau lebih rendah.
Berikut contoh cara membuat prompt yang memastikan ringkasan yang dihasilkan mengikuti struktur yang konsisten saat menganalisis perjanjian sewa-menyewa:
Kode ini mengimplementasikan fungsi summarize_document
yang menggunakan Claude untuk meringkas isi perjanjian sewa-menyewa. Fungsi ini menerima string teks dan daftar detail yang akan diekstrak sebagai input. Dalam contoh ini, kita memanggil fungsi dengan variabel document_text
dan details_to_extract
yang telah didefinisikan dalam cuplikan kode sebelumnya.
Di dalam fungsi, prompt dibuat untuk Claude, termasuk dokumen yang akan diringkas, detail yang akan diekstrak, dan instruksi spesifik untuk meringkas dokumen. Prompt menginstruksikan Claude untuk merespons dengan ringkasan setiap detail yang akan diekstrak yang bersarang dalam header XML.
Karena kita memutuskan untuk mengeluarkan setiap bagian ringkasan dalam tag, setiap bagian dapat dengan mudah diuraikan sebagai langkah pasca-pemrosesan. Pendekatan ini memungkinkan ringkasan terstruktur yang dapat disesuaikan dengan kasus penggunaan Anda, sehingga setiap ringkasan mengikuti pola yang sama.
Evaluasi prompt Anda
Prompting sering memerlukan pengujian dan optimasi agar siap untuk pro
[Message truncated due to length. Let me know if you’d like me to continue translating the rest.]
Was this page helpful?