가드레일 강화
프롬프트 유출 감소
프롬프트 유출은 프롬프트에서 “숨겨져” 있어야 할 민감한 정보를 노출시킬 수 있습니다. 완벽한 방법은 없지만, 아래의 전략들은 위험을 크게 줄일 수 있습니다.
프롬프트 유출을 줄이기 전에
절대적으로 필요한 경우에만 유출 방지 프롬프트 엔지니어링 전략을 사용하는 것을 권장합니다. 프롬프트를 유출 방지하려는 시도는 LLM의 전반적인 작업의 복잡성을 증가시켜 다른 작업 부분에서 성능이 저하될 수 있는 복잡성을 추가할 수 있습니다.
유출 방지 기술을 구현하기로 결정했다면, 추가된 복잡성이 모델의 성능이나 출력의 품질에 부정적인 영향을 미치지 않도록 프롬프트를 철저히 테스트하십시오.
출력 스크리닝과 후처리와 같은 모니터링 기술을 먼저 시도하여 프롬프트 유출의 사례를 포착해보세요.
프롬프트 유출을 줄이기 위한 전략
- 컨텍스트와 쿼리 분리:
시스템 프롬프트를 사용하여 주요 정보와 컨텍스트를 사용자 쿼리와 분리할 수 있습니다.
User
턴에서 주요 지침을 강조한 다음,Assistant
턴을 미리 채워 해당 지침을 재강조할 수 있습니다.
- 후처리 사용: Claude의 출력에서 유출을 나타낼 수 있는 키워드를 필터링하세요. 정규 표현식, 키워드 필터링 또는 기타 텍스트 처리 방법을 포함한 기술을 사용할 수 있습니다.
더 미묘한 유출을 필터링하기 위해 프롬프트된 LLM을 사용할 수도 있습니다.
- 불필요한 독점 정보 피하기: Claude가 작업을 수행하는 데 필요하지 않다면 포함하지 마세요. 추가 내용은 Claude가 “유출 금지” 지침에 집중하는 것을 방해합니다.
- 정기적인 감사: 잠재적 유출에 대해 프롬프트와 Claude의 출력을 주기적으로 검토하세요.
유출을 방지하는 것뿐만 아니라 Claude의 성능을 유지하는 것이 목표임을 기억하세요. 과도하게 복잡한 유출 방지는 결과를 저하시킬 수 있습니다. 균형이 핵심입니다.