Ce guide se concentre sur les critères de succès qui sont contrôlables par l’ingénierie des prompts.
Tous les critères de succès ou les évaluations qui échouent ne sont pas mieux résolus par l’ingénierie des prompts. Par exemple, la latence et le coût peuvent parfois être plus facilement améliorés en sélectionnant un modèle différent.
L’ingénierie des prompts est bien plus rapide que les autres méthodes de contrôle du comportement des modèles, comme le finetuning, et peut souvent donner des bonds de performance en beaucoup moins de temps. Voici quelques raisons d’envisager l’ingénierie des prompts plutôt que le finetuning :
Efficacité des ressources : Le finetuning nécessite des GPU haut de gamme et une grande mémoire, tandis que l’ingénierie des prompts ne nécessite qu’une entrée de texte, ce qui la rend beaucoup plus économe en ressources.
Rentabilité : Pour les services d’IA basés sur le cloud, le finetuning entraîne des coûts importants. L’ingénierie des prompts utilise le modèle de base, qui est généralement moins cher.
Maintien des mises à jour des modèles : Lorsque les fournisseurs mettent à jour les modèles, les versions finetuned peuvent nécessiter une nouvelle formation. Les prompts fonctionnent généralement sur toutes les versions sans changement.
Gain de temps : Le finetuning peut prendre des heures, voire des jours. En revanche, l’ingénierie des prompts fournit des résultats presque instantanés, permettant une résolution rapide des problèmes.
Besoins minimaux en données : Le finetuning nécessite des données substantielles, étiquetées et spécifiques à la tâche, qui peuvent être rares ou coûteuses. L’ingénierie des prompts fonctionne avec un apprentissage en peu de coups, voire sans exemple.
Flexibilité et itération rapide : Essayez rapidement diverses approches, ajustez les prompts et voyez les résultats immédiats. Cette expérimentation rapide est difficile avec le finetuning.
Adaptation au domaine : Adaptez facilement les modèles à de nouveaux domaines en fournissant un contexte spécifique au domaine dans les prompts, sans réentraînement.
Améliorations de la compréhension : L’ingénierie des prompts est bien plus efficace que le finetuning pour aider les modèles à mieux comprendre et utiliser le contenu externe tel que les documents récupérés.
Préserve les connaissances générales : Le finetuning risque un oubli catastrophique, où le modèle perd ses connaissances générales. L’ingénierie des prompts maintient les capacités générales du modèle.
Transparence : Les prompts sont lisibles par l’homme, montrant exactement quelles informations le modèle reçoit. Cette transparence aide à comprendre et à déboguer.
Les pages d’ingénierie des prompts de cette section ont été organisées des techniques les plus largement efficaces aux techniques plus spécialisées. Lors du dépannage des performances, nous vous suggérons d’essayer ces techniques dans l’ordre, bien que l’impact réel de chaque technique dépende de notre cas d’utilisation.