Les fuites de prompt peuvent exposer des informations sensibles que vous pensez être “cachées” dans votre prompt. Bien qu’aucune méthode ne soit infaillible, les stratégies ci-dessous peuvent réduire considérablement le risque.

Avant d’essayer de réduire la fuite de prompt

Nous recommandons d’utiliser des stratégies d’ingénierie de prompt résistantes aux fuites uniquement lorsque c’est absolument nécessaire. Les tentatives de sécurisation de votre prompt peuvent ajouter une complexité qui peut dégrader les performances dans d’autres parties de la tâche en augmentant la complexité de la tâche globale du LLM.

Si vous décidez de mettre en œuvre des techniques résistantes aux fuites, assurez-vous de tester vos prompts de manière approfondie pour garantir que la complexité ajoutée n’impacte pas négativement les performances du modèle ou la qualité de ses résultats.

Essayez d’abord les techniques de surveillance, comme le filtrage des sorties et le post-traitement, pour tenter de détecter les cas de fuite de prompt.

Stratégies pour réduire la fuite de prompt

  • Séparer le contexte des requêtes : Vous pouvez essayer d’utiliser des prompts système pour isoler les informations clés et le contexte des requêtes utilisateur. Vous pouvez mettre l’accent sur les instructions clés dans le tour User, puis réinsister sur ces instructions en pré-remplissant le tour Assistant.
  • Utiliser le post-traitement : Filtrez les sorties de Claude pour détecter les mots-clés qui pourraient indiquer une fuite. Les techniques incluent l’utilisation d’expressions régulières, le filtrage par mots-clés ou d’autres méthodes de traitement de texte.
    Vous pouvez également utiliser un LLM avec prompt pour filtrer les sorties pour des fuites plus nuancées.
  • Éviter les détails propriétaires inutiles : Si Claude n’en a pas besoin pour effectuer la tâche, ne les incluez pas. Le contenu superflu distrait Claude des instructions “pas de fuite”.
  • Audits réguliers : Examinez périodiquement vos prompts et les sorties de Claude pour détecter d’éventuelles fuites.

Rappelez-vous que l’objectif n’est pas seulement d’empêcher les fuites mais aussi de maintenir les performances de Claude. Une prévention des fuites trop complexe peut dégrader les résultats. L’équilibre est essentiel.