Esta guía se centra en los criterios de éxito que se pueden controlar mediante la ingeniería de prompts.
No todos los criterios de éxito o evaluaciones fallidas se resuelven mejor con la ingeniería de prompts. Por ejemplo, la latencia y el costo a veces se pueden mejorar más fácilmente seleccionando un modelo diferente.
La ingeniería de prompts es mucho más rápida que otros métodos de control del comportamiento del modelo, como el finetuning, y a menudo puede producir saltos en el rendimiento en mucho menos tiempo. Aquí hay algunas razones para considerar la ingeniería de prompts sobre el finetuning:
Eficiencia de recursos: El fine-tuning requiere GPUs de alta gama y gran memoria, mientras que la ingeniería de prompts solo necesita entrada de texto, haciéndola mucho más amigable con los recursos.
Rentabilidad: Para servicios de IA en la nube, el fine-tuning incurre en costos significativos. La ingeniería de prompts usa el modelo base, que típicamente es más barato.
Mantenimiento de actualizaciones del modelo: Cuando los proveedores actualizan los modelos, las versiones con fine-tuning podrían necesitar reentrenamiento. Los prompts generalmente funcionan entre versiones sin cambios.
Ahorro de tiempo: El fine-tuning puede tomar horas o incluso días. En contraste, la ingeniería de prompts proporciona resultados casi instantáneos, permitiendo una rápida resolución de problemas.
Necesidades mínimas de datos: El fine-tuning necesita datos etiquetados sustanciales específicos de la tarea, que pueden ser escasos o costosos. La ingeniería de prompts funciona con aprendizaje de pocos ejemplos o incluso sin ejemplos.
Flexibilidad e iteración rápida: Prueba rápidamente varios enfoques, ajusta prompts y ve resultados inmediatos. Esta experimentación rápida es difícil con el fine-tuning.
Adaptación al dominio: Adapta fácilmente los modelos a nuevos dominios proporcionando contexto específico del dominio en los prompts, sin reentrenamiento.
Mejoras en la comprensión: La ingeniería de prompts es mucho más efectiva que el finetuning para ayudar a los modelos a comprender mejor y utilizar contenido externo como documentos recuperados.
Preserva el conocimiento general: El fine-tuning arriesga el olvido catastrófico, donde el modelo pierde conocimiento general. La ingeniería de prompts mantiene las capacidades amplias del modelo.
Transparencia: Los prompts son legibles por humanos, mostrando exactamente qué información recibe el modelo. Esta transparencia ayuda en la comprensión y depuración.
Las páginas de ingeniería de prompts en esta sección se han organizado desde las técnicas más ampliamente efectivas hasta las técnicas más especializadas. Cuando soluciones problemas de rendimiento, sugerimos que pruebes estas técnicas en orden, aunque el impacto real de cada técnica dependerá de tu caso de uso.