프롬프트 누출은 프롬프트에 “숨겨져” 있을 것으로 예상되는 민감한 정보를 노출시킬 수 있습니다. 어떤 방법도 완벽하지는 않지만, 아래의 전략들은 위험을 상당히 줄일 수 있습니다.

프롬프트 누출을 줄이기 전에

절대적으로 필요한 경우에만 누출 방지 프롬프트 엔지니어링 전략을 사용하는 것이 좋습니다. 프롬프트를 누출 방지하려는 시도는 LLM의 전반적인 작업의 복잡성을 증가시켜 다른 부분의 성능을 저하시킬 수 있는 복잡성을 추가할 수 있습니다.

누출 방지 기술을 구현하기로 결정한 경우, 추가된 복잡성이 모델의 성능이나 출력 품질에 부정적인 영향을 미치지 않도록 프롬프트를 철저히 테스트해야 합니다.

출력 검사 및 후처리와 같은 모니터링 기술을 먼저 시도하여 프롬프트 누출 사례를 포착하십시오.

프롬프트 누출을 줄이는 전략

  • 컨텍스트와 쿼리 분리: 시스템 프롬프트를 사용하여 주요 정보와 컨텍스트를 사용자 쿼리에서 분리할 수 있습니다. User 턴에서 핵심 지침을 강조한 다음 Assistant 턴을 미리 채워 해당 지침을 다시 강조할 수 있습니다.
  • 후처리 사용: 누출을 나타낼 수 있는 키워드에 대해 Claude의 출력을 필터링합니다. 정규 표현식, 키워드 필터링 또는 기타 텍스트 처리 방법을 사용하는 기술이 포함됩니다.
    더 미묘한 누출을 필터링하기 위해 프롬프트된 LLM을 사용할 수도 있습니다.
  • 불필요한 독점 세부 정보 피하기: Claude가 작업을 수행하는 데 필요하지 않다면 포함하지 마십시오. 추가 내용은 Claude가 “누출 없음” 지침에 집중하는 것을 방해합니다.
  • 정기 감사: 잠재적 누출에 대해 프롬프트와 Claude의 출력을 정기적으로 검토하십시오.

목표는 단순히 누출을 방지하는 것이 아니라 Claude의 성능을 유지하는 것임을 기억하세요. 지나치게 복잡한 누출 방지는 결과를 저하시킬 수 있습니다. 균형이 핵심입니다.