max_tokens
para establecer un límite estricto en la longitud máxima de la respuesta generada. Esto evita que Claude genere salidas excesivamente largas.
Nota: Cuando la respuesta alcanza los tokens max_tokens
, la respuesta se cortará, quizás a mitad de oración o palabra, por lo que esta es una técnica brusca que puede requerir post-procesamiento y generalmente es más apropiada para respuestas de opción múltiple o respuestas cortas donde la respuesta viene justo al principio.
temperature
controla la aleatoriedad de la salida. Valores más bajos (por ejemplo, 0.2) pueden llevar a respuestas más enfocadas y cortas, mientras que valores más altos (por ejemplo, 0.8) pueden resultar en salidas más diversas pero potencialmente más largas.