ガードレールを強化する
プロンプトリークの削減
プロンプトリークは、プロンプト内で「隠されている」はずの機密情報を露出させる可能性があります。完璧な方法はありませんが、以下の戦略によってリスクを大幅に軽減することができます。
プロンプトリーク削減を試みる前に
リーク耐性のあるプロンプトエンジニアリング戦略は、絶対に必要な場合にのみ使用することをお勧めします。プロンプトをリーク防止にしようとする試みは、LLMの全体的なタスクの複雑さを増加させることにより、タスクの他の部分のパフォーマンスを低下させる可能性のある複雑さを追加する可能性があります。
リーク耐性のある技術を実装することを決めた場合は、追加された複雑さがモデルのパフォーマンスや出力の品質に悪影響を与えないことを確認するため、プロンプトを徹底的にテストしてください。
まず、出力のスクリーニングや後処理などのモニタリング技術を試して、プロンプトリークの事例を捕捉することを試みてください。
プロンプトリークを削減するための戦略
- コンテキストをクエリから分離する:
システムプロンプトを使用して、重要な情報とコンテキストをユーザークエリから分離することができます。
User
ターンで重要な指示を強調し、Assistant
ターンを事前に入力することでそれらの指示を再度強調することができます。
- 後処理を使用する:Claudeの出力をリークを示す可能性のあるキーワードでフィルタリングします。正規表現、キーワードフィルタリング、その他のテキスト処理方法などの技術を使用します。
より微妙なリークをフィルタリングするために、プロンプトを与えられたLLMを使用することもできます。
- 不必要な独自の詳細を避ける:Claudeがタスクを実行するために必要でない場合は、含めないでください。余分なコンテンツはClaudeの「リーク禁止」指示への集中を妨げます。
- 定期的な監査:プロンプトとClaudeの出力を定期的に確認し、潜在的なリークがないか確認します。
リークを防ぐだけでなく、Claudeのパフォーマンスを維持することが目標であることを忘れないでください。過度に複雑なリーク防止は結果を低下させる可能性があります。バランスが重要です。