Ce guide se concentre sur les critères de réussite qui peuvent être contrôlés par l’ingénierie des prompts.
Tous les critères de réussite ou les évaluations échouées ne se résolvent pas forcément par l’ingénierie des prompts. Par exemple, la latence et le coût peuvent parfois être améliorés plus facilement en sélectionnant un modèle différent.
L’ingénierie des prompts est beaucoup plus rapide que d’autres méthodes de contrôle du comportement des modèles, comme le finetuning, et peut souvent produire des bonds de performance en beaucoup moins de temps. Voici quelques raisons de considérer l’ingénierie des prompts plutôt que le finetuning :
Efficacité des ressources : Le fine-tuning nécessite des GPU haut de gamme et une grande mémoire, tandis que l’ingénierie des prompts ne nécessite que des entrées textuelles, ce qui la rend beaucoup plus économe en ressources.
Rentabilité : Pour les services d’IA basés sur le cloud, le fine-tuning entraîne des coûts importants. L’ingénierie des prompts utilise le modèle de base, qui est généralement moins cher.
Maintenance des mises à jour du modèle : Lorsque les fournisseurs mettent à jour les modèles, les versions fine-tunées peuvent nécessiter un réentraînement. Les prompts fonctionnent généralement à travers les versions sans changements.
Gain de temps : Le fine-tuning peut prendre des heures, voire des jours. En revanche, l’ingénierie des prompts fournit des résultats quasi instantanés, permettant une résolution rapide des problèmes.
Besoins minimaux en données : Le fine-tuning nécessite des données étiquetées substantielles et spécifiques à la tâche, qui peuvent être rares ou coûteuses. L’ingénierie des prompts fonctionne avec peu d’exemples ou même sans exemple.
Flexibilité et itération rapide : Essayez rapidement diverses approches, ajustez les prompts et voyez les résultats immédiatement. Cette expérimentation rapide est difficile avec le fine-tuning.
Adaptation au domaine : Adaptez facilement les modèles à de nouveaux domaines en fournissant un contexte spécifique au domaine dans les prompts, sans réentraînement.
Améliorations de la compréhension : L’ingénierie des prompts est beaucoup plus efficace que le finetuning pour aider les modèles à mieux comprendre et utiliser le contenu externe tel que les documents récupérés.
Préserve les connaissances générales : Le fine-tuning risque l’oubli catastrophique, où le modèle perd ses connaissances générales. L’ingénierie des prompts maintient les capacités générales du modèle.
Transparence : Les prompts sont lisibles par l’homme, montrant exactement quelles informations le modèle reçoit. Cette transparence aide à la compréhension et au débogage.
Les pages d’ingénierie des prompts dans cette section ont été organisées des techniques les plus largement efficaces aux techniques plus spécialisées. Lors du dépannage des performances, nous vous suggérons d’essayer ces techniques dans l’ordre, bien que l’impact réel de chaque technique dépendra de votre cas d’utilisation.