Les fuites de prompt peuvent exposer des informations sensibles que vous vous attendez à “cacher” dans votre prompt. Bien qu’aucune méthode ne soit infaillible, les stratégies ci-dessous peuvent réduire considérablement le risque.

Avant d’essayer de réduire les fuites de prompt

Nous recommandons d’utiliser des stratégies d’ingénierie de prompt résistantes aux fuites uniquement lorsque c’est absolument nécessaire. Les tentatives de rendre votre prompt à l’épreuve des fuites peuvent ajouter une complexité qui peut dégrader les performances dans d’autres parties de la tâche en raison de l’augmentation de la complexité de la tâche globale du LLM.

Si vous décidez de mettre en œuvre des techniques résistantes aux fuites, assurez-vous de tester soigneusement vos prompts pour vous assurer que la complexité ajoutée n’a pas d’impact négatif sur les performances du modèle ou la qualité de ses sorties.

Essayez d’abord les techniques de surveillance, comme le filtrage des sorties et le post-traitement, pour essayer de détecter les instances de fuite de prompt.

Stratégies pour réduire les fuites de prompt

  • Séparer le contexte des requêtes : Vous pouvez essayer d’utiliser des prompts système pour isoler les informations clés et le contexte des requêtes utilisateur. Vous pouvez mettre l’accent sur les instructions clés dans le tour User, puis réaffirmer ces instructions en pré-remplissant le tour Assistant.
  • Utiliser le post-traitement : Filtrez les sorties de Claude pour les mots-clés qui pourraient indiquer une fuite. Les techniques comprennent l’utilisation d’expressions régulières, le filtrage par mots-clés ou d’autres méthodes de traitement de texte.
    Vous pouvez également utiliser un LLM avec prompt pour filtrer les sorties pour des fuites plus nuancées.
  • Éviter les détails propriétaires inutiles : Si Claude n’en a pas besoin pour effectuer la tâche, ne les incluez pas. Le contenu supplémentaire distrait Claude de se concentrer sur les instructions “pas de fuite”.
  • Audits réguliers : Examinez périodiquement vos prompts et les sorties de Claude pour détecter les fuites potentielles.

N’oubliez pas que l’objectif n’est pas seulement d’empêcher les fuites, mais de maintenir les performances de Claude. Une prévention des fuites trop complexe peut dégrader les résultats. L’équilibre est essentiel.