Kebocoran prompt dapat mengungkapkan informasi sensitif yang Anda harapkan “tersembunyi” dalam prompt Anda. Meskipun tidak ada metode yang sempurna, strategi di bawah ini dapat secara signifikan mengurangi risiko.

Sebelum Anda mencoba mengurangi kebocoran prompt

Kami menyarankan untuk menggunakan strategi rekayasa prompt yang tahan kebocoran hanya ketika benar-benar diperlukan. Upaya untuk membuat prompt Anda tahan kebocoran dapat menambah kompleksitas yang mungkin menurunkan kinerja di bagian lain dari tugas karena meningkatkan kompleksitas tugas keseluruhan LLM.

Jika Anda memutuskan untuk menerapkan teknik tahan kebocoran, pastikan untuk menguji prompt Anda secara menyeluruh untuk memastikan bahwa kompleksitas tambahan tidak berdampak negatif pada kinerja model atau kualitas outputnya.

Cobalah teknik pemantauan terlebih dahulu, seperti penyaringan output dan pemrosesan pasca, untuk mencoba menangkap contoh kebocoran prompt.

Strategi untuk mengurangi kebocoran prompt

  • Pisahkan konteks dari pertanyaan: Anda dapat mencoba menggunakan prompt sistem untuk mengisolasi informasi kunci dan konteks dari pertanyaan pengguna. Anda dapat menekankan instruksi kunci dalam giliran User, kemudian menekankan kembali instruksi tersebut dengan mengisi terlebih dahulu giliran Assistant.
  • Gunakan pemrosesan pasca: Filter output Claude untuk kata kunci yang mungkin menunjukkan kebocoran. Teknik ini termasuk menggunakan ekspresi reguler, penyaringan kata kunci, atau metode pemrosesan teks lainnya.
    Anda juga dapat menggunakan LLM yang diprompt untuk menyaring output untuk kebocoran yang lebih halus.
  • Hindari detail kepemilikan yang tidak perlu: Jika Claude tidak membutuhkannya untuk melakukan tugas, jangan sertakan. Konten tambahan mengalihkan perhatian Claude dari fokus pada instruksi “tidak ada kebocoran”.
  • Audit rutin: Secara berkala tinjau prompt Anda dan output Claude untuk potensi kebocoran.

Ingat, tujuannya bukan hanya untuk mencegah kebocoran tetapi juga untuk mempertahankan kinerja Claude. Pencegahan kebocoran yang terlalu kompleks dapat menurunkan hasil. Keseimbangan adalah kunci.