Утечки промптов могут раскрыть конфиденциальную информацию, которая, как предполагается, должна быть “скрыта” в вашем промпте. Хотя ни один метод не является безупречным, приведенные ниже стратегии могут значительно снизить риск.

Прежде чем пытаться уменьшить утечку промпта

Мы рекомендуем использовать стратегии защиты промптов от утечек только когда это абсолютно необходимо. Попытки защитить ваш промпт от утечек могут добавить сложность, которая может ухудшить производительность в других частях задачи из-за увеличения сложности общей задачи для LLM.

Если вы решите внедрить методы защиты от утечек, обязательно тщательно протестируйте ваши промпты, чтобы убедиться, что добавленная сложность не оказывает негативного влияния на производительность модели или качество её выходных данных.

Сначала попробуйте методы мониторинга, такие как проверка выходных данных и постобработка, чтобы попытаться обнаружить случаи утечки промпта.

Стратегии уменьшения утечки промпта

  • Отделяйте контекст от запросов: Вы можете попробовать использовать системные промпты для изоляции ключевой информации и контекста от пользовательских запросов. Вы можете подчеркнуть ключевые инструкции в очереди User, затем повторно подчеркнуть эти инструкции, предварительно заполнив очередь Assistant.
  • Используйте постобработку: Фильтруйте выходные данные Claude на предмет ключевых слов, которые могут указывать на утечку. Методы включают использование регулярных выражений, фильтрацию по ключевым словам или другие методы обработки текста.
    Вы также можете использовать LLM с промптами для фильтрации выходных данных на предмет более тонких утечек.
  • Избегайте ненужных проприетарных деталей: Если Claude не нуждается в этом для выполнения задачи, не включайте это. Дополнительный контент отвлекает Claude от фокусировки на инструкциях “без утечек”.
  • Регулярные проверки: Периодически проверяйте ваши промпты и выходные данные Claude на предмет потенциальных утечек.

Помните, цель не только предотвратить утечки, но и сохранить производительность Claude. Чрезмерно сложная защита от утечек может ухудшить результаты. Баланс - ключевой фактор.