Tous les modèles Opus et Sonnet publiés après Claude Sonnet 3.7 prennent en charge les modes de réflexion standard et étendue. En mode standard, ces modèles fonctionnent de manière similaire aux modèles Claude précédents. En mode de réflexion étendue, Claude affichera son raisonnement avant de produire sa réponse, vous permettant ainsi d’avoir un aperçu de son processus de réflexion.

Aperçu de la réflexion étendue

Les modèles de réflexion étendue fonctionnent selon deux modes :

  • Mode standard : Similaire aux modèles Claude précédents, fournissant des réponses directes sans montrer le raisonnement interne
  • Mode de réflexion étendue : Montre le processus de raisonnement de Claude avant de livrer la réponse finale

Quand utiliser le mode standard

Le mode standard fonctionne bien pour la plupart des cas d’utilisation généraux, notamment :

  • Génération de contenu général
  • Assistance de codage de base
  • Tâches d’agent de routine
  • Conseils d’utilisation d’ordinateur
  • La plupart des applications conversationnelles

Quand utiliser le mode de réflexion étendue

Le mode de réflexion étendue excelle dans ces domaines clés :

  • Analyse complexe : Analyse financière, juridique ou de données impliquant de multiples paramètres et facteurs
  • Problèmes STEM avancés : Mathématiques, physique, recherche et développement
  • Gestion de contexte long : Traitement et synthèse d’informations à partir d’entrées extensives
  • Optimisation sous contraintes : Problèmes avec plusieurs exigences concurrentes
  • Génération détaillée de données : Création d’ensembles d’informations structurées ou de tableaux complets
  • Suivi d’instructions complexes : Chatbots avec des prompts système complexes et de nombreux facteurs à prendre en compte
  • Tâches créatives structurées : Écriture créative nécessitant une planification détaillée, des plans ou la gestion de multiples éléments narratifs

Pour en savoir plus sur le fonctionnement de la réflexion étendue, consultez Réflexion étendue.


Premiers pas avec les modèles de réflexion étendue

Si vous essayez la réflexion étendue pour la première fois, voici quelques conseils :

  1. Commencez par le mode standard : Commencez par utiliser votre modèle Opus ou Sonnet choisi sans réflexion étendue pour établir une performance de référence
  2. Identifiez les opportunités d’amélioration : Essayez d’activer le mode de réflexion étendue avec un budget limité pour voir si votre cas d’utilisation bénéficierait d’un raisonnement plus approfondi. Il se peut que votre cas d’utilisation bénéficie davantage d’un prompt plus détaillé en mode standard plutôt que d’une réflexion étendue de Claude.
  3. Mise en œuvre progressive : Si nécessaire, augmentez progressivement le budget de réflexion tout en testant les performances par rapport à vos exigences.
  4. Optimisez l’utilisation des tokens : Une fois que vous atteignez des performances acceptables, définissez des limites de tokens appropriées pour gérer les coûts.
  5. Explorez de nouvelles possibilités : Nos derniers modèles Opus et Sonnet, avec ou sans réflexion étendue, sont plus performants que les modèles Claude précédents dans divers domaines. Nous vous encourageons à essayer ces modèles pour des cas d’utilisation où vous avez précédemment rencontré des limitations avec d’autres modèles.

Construire avec des modèles de réflexion étendue

Informations générales sur les modèles

Pour les tarifs, la taille de la fenêtre de contexte et d’autres informations sur tous les modèles Claude actuels avec prise en charge de la réflexion étendue, consultez Aperçu de tous les modèles.

Modifications des tokens maximum et de la fenêtre de contexte avec les modèles de réflexion étendue

Dans les anciens modèles Claude (avant les modèles de réflexion étendue), si la somme des tokens du prompt et de max_tokens dépassait la fenêtre de contexte du modèle, le système ajustait automatiquement max_tokens pour s’adapter à la limite de contexte. Cela signifiait que vous pouviez définir une grande valeur max_tokens et le système la réduisait silencieusement selon les besoins.

Avec les modèles de réflexion étendue, max_tokens (qui inclut votre budget de réflexion lorsque la réflexion est activée) est appliqué comme une limite stricte. Le système renverra désormais une erreur de validation si les tokens du prompt + max_tokens dépassent la taille de la fenêtre de contexte.

Migration vers des modèles de réflexion étendue à partir de modèles plus anciens

Si vous transférez des prompts d’un autre modèle, qu’il s’agisse d’un autre modèle Claude ou d’un autre fournisseur de modèle, voici quelques conseils :

Migration en mode standard

  • Simplifiez vos prompts : Les modèles de réflexion étendue nécessitent moins de guidage. Supprimez tout langage de guidage spécifique au modèle que vous avez utilisé avec les versions précédentes, comme le langage concernant la gestion de la verbosité - un tel langage est probablement inutile et permettra d’économiser des tokens et de réduire les coûts.

Sinon, généralement aucun changement de prompt n’est nécessaire si vous utilisez ces modèles avec la réflexion étendue désactivée. Si vous rencontrez des problèmes, appliquez les meilleures pratiques générales d’ingénierie de prompt.

Migration en mode de réflexion étendue

Lorsque vous utilisez la réflexion étendue, commencez par supprimer toutes les instructions de chaîne de pensée (CoT) de vos prompts. Les modèles de réflexion étendue sont conçus pour fonctionner efficacement sans instructions de raisonnement explicites.

  • Au lieu de prescrire des modèles de pensée, observez d’abord le processus de réflexion naturel de Claude, puis ajustez vos prompts en fonction de ce que vous voyez.
  • Si vous souhaitez ensuite fournir des conseils de réflexion, vous pouvez inclure des conseils en langage naturel dans votre prompt et Claude pourra généraliser ces instructions dans sa propre réflexion.
  • Pour plus de conseils sur la façon de formuler des prompts pour la réflexion étendue, consultez Conseils pour la réflexion étendue.

Migration depuis d’autres fournisseurs de modèles

Les modèles de réflexion étendue de Claude peuvent répondre différemment aux modèles de prompts optimisés pour les modèles d’autres fournisseurs. Nous recommandons de se concentrer sur des instructions claires et directes plutôt que sur des techniques de prompt spécifiques à un fournisseur. La suppression de telles instructions adaptées à des fournisseurs de modèles spécifiques peut conduire à de meilleures performances, car Claude est généralement bon pour suivre des instructions complexes dès le départ.

Vous pouvez utiliser notre améliorateur de prompt optimisé sur console.anthropic.com pour vous aider à migrer des prompts.


Prochaines étapes