Modèles de réflexion étendue
Claude 3.7 Sonnet est un modèle hybride capable à la fois de réflexion standard et de modes de réflexion étendue. En mode standard, Claude 3.7 Sonnet fonctionne de manière similaire aux autres modèles de la famille Claude 3. En mode de réflexion étendue, Claude affichera son raisonnement avant de donner sa réponse, vous permettant ainsi de comprendre son processus de réflexion.
Aperçu de Claude 3.7
Claude 3.7 Sonnet fonctionne selon deux modes :
- Mode standard : Similaire aux modèles Claude précédents, fournissant des réponses directes sans montrer le raisonnement interne
- Mode de réflexion étendue : Montre le processus de réflexion de Claude avant de délivrer la réponse finale
Quand utiliser le mode standard
Le mode standard fonctionne bien pour la plupart des cas d’utilisation généraux, notamment :
- Génération de contenu général
- Assistance de base en programmation
- Tâches d’agent de routine
- Conseils d’utilisation informatique
- La plupart des applications conversationnelles
Quand utiliser le mode de réflexion étendue
Le mode de réflexion étendue excelle dans ces domaines clés :
- Analyse complexe : Analyse financière, juridique ou de données impliquant de multiples paramètres et facteurs
- Problèmes STEM avancés : Mathématiques, physique, recherche et développement
- Gestion de contexte long : Traitement et synthèse d’informations à partir d’entrées extensives
- Optimisation sous contraintes : Problèmes avec plusieurs exigences concurrentes
- Génération détaillée de données : Création de tableaux complets ou d’ensembles d’informations structurées
- Suivi d’instructions complexes : Chatbots avec des prompts système complexes et de nombreux facteurs à prendre en compte
- Tâches créatives structurées : Écriture créative nécessitant une planification détaillée, des plans ou la gestion de multiples éléments narratifs
Pour en savoir plus sur le fonctionnement de la réflexion étendue, consultez Réflexion étendue.
Premiers pas avec Claude 3.7 Sonnet
Si vous essayez Claude 3.7 Sonnet pour la première fois, voici quelques conseils :
- Commencez par le mode standard : Commencez par utiliser Claude 3.7 Sonnet sans réflexion étendue pour établir une performance de référence
- Identifiez les opportunités d’amélioration : Essayez d’activer le mode de réflexion étendue avec un budget faible pour voir si votre cas d’utilisation bénéficierait d’un raisonnement plus approfondi. Il se peut que votre cas d’utilisation bénéficie davantage d’un prompt plus détaillé en mode standard plutôt que d’une réflexion étendue de Claude.
- Mise en œuvre progressive : Si nécessaire, augmentez progressivement le budget de réflexion tout en testant les performances par rapport à vos exigences.
- Optimisez l’utilisation des tokens : Une fois que vous atteignez des performances acceptables, définissez des limites de tokens appropriées pour gérer les coûts.
- Explorez de nouvelles possibilités : Claude 3.7 Sonnet, avec ou sans réflexion étendue, est plus performant que les modèles Claude précédents dans divers domaines. Nous vous encourageons à essayer Claude 3.7 Sonnet pour des cas d’utilisation où vous avez précédemment rencontré des limitations avec d’autres modèles.
Construire avec Claude 3.7 Sonnet
Informations générales sur le modèle
Pour les prix, la taille de la fenêtre de contexte et d’autres informations sur Claude 3.7 Sonnet et tous les autres modèles Claude actuels, consultez Aperçu de tous les modèles.
Changements de tokens maximum et de fenêtre de contexte avec Claude 3.7 Sonnet
Dans les anciens modèles Claude (avant Claude 3.7 Sonnet), si la somme des tokens du prompt et de max_tokens
dépassait la fenêtre de contexte du modèle, le système ajustait automatiquement max_tokens
pour s’adapter à la limite de contexte. Cela signifiait que vous pouviez définir une grande valeur max_tokens
et le système la réduirait silencieusement selon les besoins.
Avec Claude 3.7 Sonnet, max_tokens
(qui inclut votre budget de réflexion lorsque la réflexion est activée) est appliqué comme une limite stricte. Le système renverra maintenant une erreur de validation si les tokens du prompt + max_tokens
dépassent la taille de la fenêtre de contexte.
Capacités de sortie étendues (bêta)
Claude 3.7 Sonnet peut également produire des réponses substantiellement plus longues que les modèles précédents avec une prise en charge jusqu’à 128K tokens de sortie (bêta) — plus de 15 fois plus long que les autres modèles Claude. Cette capacité étendue est particulièrement efficace pour les cas d’utilisation de réflexion étendue impliquant un raisonnement complexe, une génération de code riche et une création de contenu complète.
Cette fonctionnalité peut être activée en passant un en-tête anthropic-beta
de output-128k-2025-02-19
.
Lors de l’utilisation de la réflexion étendue avec des sorties plus longues, vous pouvez allouer un budget de réflexion plus important pour soutenir un raisonnement plus approfondi, tout en disposant encore de nombreux tokens pour la réponse finale.
Migration vers Claude 3.7 Sonnet depuis d’autres modèles
Si vous transférez des prompts depuis un autre modèle, qu’il s’agisse d’un autre modèle Claude ou d’un autre fournisseur de modèles, voici quelques conseils :
Migration en mode standard
- Simplifiez vos prompts : Claude 3.7 Sonnet nécessite moins de guidage. Supprimez tout langage de guidage spécifique au modèle que vous avez utilisé avec les versions précédentes, comme le langage concernant la gestion de la verbosité - un tel langage est probablement inutile et permettra d’économiser des tokens et de réduire les coûts.
Sinon, généralement aucun changement de prompt n’est nécessaire si vous utilisez Claude 3.7 Sonnet avec la réflexion étendue désactivée. Si vous rencontrez des problèmes, appliquez les meilleures pratiques générales d’ingénierie de prompt.
Migration en mode de réflexion étendue
Lors de l’utilisation de la réflexion étendue, commencez par supprimer toutes les directives de chaîne de pensée (CoT) de vos prompts. La capacité de réflexion de Claude 3.7 Sonnet est conçue pour fonctionner efficacement sans instructions de raisonnement explicites.
- Au lieu de prescrire des modèles de pensée, observez d’abord le processus de réflexion naturel de Claude, puis ajustez vos prompts en fonction de ce que vous voyez.
- Si vous souhaitez ensuite fournir des conseils de réflexion, vous pouvez inclure des conseils en langage naturel dans votre prompt et Claude pourra généraliser ces instructions dans sa propre réflexion.
- Pour plus de conseils sur la façon de formuler des prompts pour la réflexion étendue, consultez Conseils pour la réflexion étendue.
Migration depuis d’autres fournisseurs de modèles
Claude 3.7 Sonnet peut répondre différemment aux modèles de prompts optimisés pour les modèles d’autres fournisseurs. Nous recommandons de se concentrer sur des instructions claires et directes plutôt que sur des techniques de prompt spécifiques aux fournisseurs. La suppression de telles instructions adaptées à des fournisseurs de modèles spécifiques peut conduire à de meilleures performances, car Claude est généralement bon pour suivre des instructions complexes dès le départ.
Vous pouvez utiliser notre améliorateur de prompt optimisé sur console.anthropic.com pour vous aider à migrer les prompts.
Prochaines étapes
Essayez le livre de recettes de réflexion étendue
Explorez des exemples pratiques de réflexion dans notre livre de recettes.
Documentation sur la réflexion étendue
En savoir plus sur le fonctionnement de la réflexion étendue et comment la mettre en œuvre avec d’autres fonctionnalités telles que l’utilisation d’outils et la mise en cache des prompts.
Was this page helpful?