Ce guide fournit des stratégies et techniques avancées pour tirer le meilleur parti des fonctionnalités de réflexion approfondie de Claude. La réflexion approfondie permet à Claude de résoudre des problèmes complexes étape par étape, améliorant ainsi ses performances sur des tâches difficiles.

Consultez Modèles de réflexion approfondie pour obtenir des conseils sur quand utiliser la réflexion approfondie.

Avant de commencer

Ce guide présuppose que vous avez déjà décidé d’utiliser le mode de réflexion approfondie et que vous avez consulté nos étapes de base sur comment démarrer avec la réflexion approfondie ainsi que notre guide d’implémentation de la réflexion approfondie.

Considérations techniques pour la réflexion approfondie

  • Les tokens de réflexion ont un budget minimum de 1024 tokens. Nous recommandons de commencer avec le budget de réflexion minimum et de l’augmenter progressivement en fonction de vos besoins et de la complexité de la tâche.
  • Pour les charges de travail où le budget de réflexion optimal dépasse 32K, nous recommandons d’utiliser le traitement par lots pour éviter les problèmes de réseau. Les requêtes poussant le modèle à réfléchir au-delà de 32K tokens entraînent des requêtes de longue durée qui pourraient se heurter aux délais d’expiration du système et aux limites de connexions ouvertes.
  • La réflexion approfondie fonctionne mieux en anglais, bien que les résultats finaux puissent être dans n’importe quelle langue prise en charge par Claude.
  • Si vous avez besoin d’une réflexion en dessous du budget minimum, nous recommandons d’utiliser le mode standard, avec la réflexion désactivée, avec un prompt traditionnel de chaîne de pensée avec des balises XML (comme <thinking>). Voir prompting par chaîne de pensée.

Techniques de prompting pour la réflexion approfondie

Utilisez d’abord des instructions générales, puis résolvez les problèmes avec des instructions plus détaillées

Claude obtient souvent de meilleurs résultats avec des instructions de haut niveau pour réfléchir en profondeur à une tâche plutôt qu’avec des conseils prescriptifs étape par étape. La créativité du modèle dans l’approche des problèmes peut dépasser la capacité d’un humain à prescrire le processus de réflexion optimal.

Par exemple, au lieu de :

Réfléchis à ce problème mathématique étape par étape :
1. D'abord, identifie les variables
2. Ensuite, établis l'équation
3. Puis, résous pour x
...

Considérez plutôt :

Réfléchis à ce problème mathématique de manière approfondie et très détaillée.
Envisage plusieurs approches et montre ton raisonnement complet.
Essaie différentes méthodes si ta première approche ne fonctionne pas.

Cela dit, Claude peut toujours suivre efficacement des étapes d’exécution structurées complexes lorsque nécessaire. Le modèle peut gérer des listes encore plus longues avec des instructions plus complexes que les versions précédentes. Nous recommandons de commencer par des instructions plus générales, puis de lire la sortie de réflexion de Claude et d’itérer pour fournir des instructions plus spécifiques pour orienter sa réflexion à partir de là.

Prompting multi-exemples avec réflexion approfondie

Le prompting multi-exemples fonctionne bien avec la réflexion approfondie. Lorsque vous fournissez à Claude des exemples de réflexion sur des problèmes, il suivra des schémas de raisonnement similaires dans ses blocs de réflexion approfondie.

Vous pouvez inclure des exemples few-shot dans votre prompt dans des scénarios de réflexion approfondie en utilisant des balises XML comme <thinking> ou <scratchpad> pour indiquer des modèles canoniques de réflexion approfondie dans ces exemples.

Claude généralisera le modèle au processus formel de réflexion approfondie. Cependant, il est possible que vous obteniez de meilleurs résultats en laissant Claude libre de réfléchir de la manière qu’il juge la meilleure.

Exemple :

Je vais te montrer comment résoudre un problème mathématique, puis je veux que tu en résolves un similaire.

Problème 1 : Combien font 15% de 80 ?

<thinking>
Pour trouver 15% de 80 :
1. Convertir 15% en décimal : 15% = 0,15
2. Multiplier : 0,15 × 80 = 12
</thinking>

La réponse est 12.

Maintenant résous celui-ci :
Problème 2 : Combien font 35% de 240 ?

Maximiser le suivi des instructions avec la réflexion approfondie

Claude montre une amélioration significative du suivi des instructions lorsque la réflexion approfondie est activée. Le modèle généralement :

  1. Raisonne sur les instructions à l’intérieur du bloc de réflexion approfondie
  2. Exécute ces instructions dans la réponse

Pour maximiser le suivi des instructions :

  • Soyez clair et précis sur ce que vous voulez
  • Pour les instructions complexes, envisagez de les décomposer en étapes numérotées que Claude devrait suivre méthodiquement
  • Accordez à Claude un budget suffisant pour traiter pleinement les instructions dans sa réflexion approfondie

Utiliser la réflexion approfondie pour déboguer et orienter le comportement de Claude

Vous pouvez utiliser la sortie de réflexion de Claude pour déboguer sa logique, bien que cette méthode ne soit pas toujours parfaitement fiable.

Pour tirer le meilleur parti de cette méthodologie, nous recommandons les conseils suivants :

  • Nous ne recommandons pas de renvoyer la réflexion approfondie de Claude dans le bloc de texte utilisateur, car cela n’améliore pas les performances et peut en fait dégrader les résultats.
  • Le préremplissage de la réflexion approfondie est explicitement interdit, et la modification manuelle du texte de sortie du modèle qui suit son bloc de réflexion risque de dégrader les résultats en raison de la confusion du modèle.

Lorsque la réflexion approfondie est désactivée, le préremplissage standard du texte de réponse de l’assistant est toujours autorisé.

Parfois, Claude peut répéter sa réflexion approfondie dans le texte de sortie de l’assistant. Si vous souhaitez une réponse claire, demandez à Claude de ne pas répéter sa réflexion approfondie et de ne produire que la réponse.

Tirer le meilleur parti des sorties longues et de la réflexion longue

Pour les cas d’utilisation de génération de jeux de données, essayez des prompts comme “Crée un tableau extrêmement détaillé de…” pour générer des jeux de données complets.

Pour les cas d’utilisation tels que la génération de contenu détaillé où vous pourriez vouloir générer des blocs de réflexion approfondie plus longs et des réponses plus détaillées, essayez ces conseils :

  • Augmentez à la fois la longueur maximale de réflexion approfondie ET demandez explicitement des sorties plus longues
  • Pour les sorties très longues (plus de 20 000 mots), demandez un plan détaillé avec des nombres de mots jusqu’au niveau du paragraphe. Demandez ensuite à Claude d’indexer ses paragraphes selon le plan et de maintenir les nombres de mots spécifiés

Nous ne recommandons pas de pousser Claude à produire plus de tokens pour le simple fait de produire des tokens. Nous vous encourageons plutôt à commencer avec un petit budget de réflexion et à l’augmenter selon les besoins pour trouver les paramètres optimaux pour votre cas d’utilisation.

Voici des exemples de cas d’utilisation où Claude excelle grâce à une réflexion approfondie plus longue :

Demander à Claude de réfléchir et de vérifier son travail pour améliorer la cohérence et la gestion des erreurs

Vous pouvez utiliser un prompting en langage naturel simple pour améliorer la cohérence et réduire les erreurs :

  1. Demandez à Claude de vérifier son travail avec un test simple avant de déclarer une tâche terminée
  2. Demandez au modèle d’analyser si son étape précédente a atteint le résultat attendu
  3. Pour les tâches de codage, demandez à Claude d’exécuter des cas de test dans sa réflexion approfondie

Exemple :

Écris une fonction pour calculer la factorielle d'un nombre.
Avant de terminer, vérifie ta solution avec des cas de test pour :
- n=0
- n=1
- n=5
- n=10
Et corrige tous les problèmes que tu trouves.

Prochaines étapes