max_tokens
pour définir une limite stricte sur la longueur maximale de la réponse générée. Cela empêche Claude de générer des sorties trop longues.
Note : Lorsque la réponse atteint max_tokens
tokens, la réponse sera coupée, peut-être en pleine phrase ou en plein mot, donc c’est une technique brutale qui peut nécessiter un post-traitement et est généralement plus appropriée pour les réponses à choix multiples ou courtes où la réponse arrive dès le début.
temperature
contrôle l’aléatoire de la sortie. Des valeurs plus basses (par exemple, 0,2) peuvent parfois conduire à des réponses plus ciblées et plus courtes, tandis que des valeurs plus élevées (par exemple, 0,8) peuvent donner des sorties plus diverses mais potentiellement plus longues.