Утечки промпта могут раскрыть конфиденциальную информацию, которую вы ожидаете “скрыть” в своем промпте. Хотя ни один метод не является безупречным, стратегии, описанные ниже, могут значительно снизить риск.

Прежде чем пытаться уменьшить утечку промпта

Мы рекомендуем использовать стратегии разработки промптов, устойчивых к утечкам, только в случае крайней необходимости. Попытки защитить промпт от утечек могут добавить сложность, которая может ухудшить производительность в других частях задачи из-за увеличения сложности общей задачи LLM.

Если вы решите внедрить методы защиты от утечек, обязательно тщательно протестируйте свои промпты, чтобы убедиться, что добавленная сложность не оказывает негативного влияния на производительность модели или качество ее выходных данных.

Сначала попробуйте методы мониторинга, такие как проверка выходных данных и постобработка, чтобы попытаться обнаружить случаи утечки промпта.

Стратегии снижения утечки промпта

  • Отделение контекста от запросов: Вы можете попробовать использовать системные промпты для изоляции ключевой информации и контекста от пользовательских запросов. Вы можете выделить ключевые инструкции в ходе User, а затем повторно выделить эти инструкции, предварительно заполнив ход Assistant.
  • Использование постобработки: Фильтруйте выходные данные Claude на наличие ключевых слов, которые могут указывать на утечку. Методы включают использование регулярных выражений, фильтрацию по ключевым словам или другие методы обработки текста.
    Вы также можете использовать LLM с промптом для фильтрации выходных данных на предмет более нюансированных утечек.
  • Избегайте ненужных проприетарных деталей: Если Claude не нужна эта информация для выполнения задачи, не включайте ее. Лишний контент отвлекает Claude от сосредоточения на инструкциях “без утечек”.
  • Регулярные проверки: Периодически просматривайте свои промпты и выходные данные Claude на предмет потенциальных утечек.

Помните, цель состоит не только в предотвращении утечек, но и в поддержании производительности Claude. Чрезмерно сложная защита от утечек может ухудшить результаты. Ключевым является баланс.