max_tokens
untuk menetapkan batas keras pada panjang maksimum respons yang dihasilkan. Ini mencegah Claude menghasilkan output yang terlalu panjang.
Catatan: Ketika respons mencapai token max_tokens
, respons akan terpotong, mungkin di tengah kalimat atau di tengah kata, jadi ini adalah teknik kasar yang mungkin memerlukan pemrosesan pasca dan biasanya paling sesuai untuk pilihan ganda atau respons jawaban singkat di mana jawaban muncul tepat di awal.
temperature
mengontrol keacakan output. Nilai yang lebih rendah (misalnya, 0,2) terkadang dapat menghasilkan respons yang lebih fokus dan lebih pendek, sementara nilai yang lebih tinggi (misalnya, 0,8) dapat menghasilkan output yang lebih beragam tetapi berpotensi lebih panjang.