Este guia se concentra em critérios de sucesso que são controláveis por meio da engenharia de prompts.
Nem todos os critérios de sucesso ou avaliações com falha são melhor resolvidos pela engenharia de prompts. Por exemplo, a latência e o custo às vezes podem ser melhorados mais facilmente selecionando um modelo diferente.
A engenharia de prompts é muito mais rápida do que outros métodos de controle de comportamento do modelo, como o finetuning, e muitas vezes pode produzir saltos de desempenho em muito menos tempo. Aqui estão algumas razões para considerar a engenharia de prompts em vez do finetuning:
Eficiência de recursos: O finetuning requer GPUs de ponta e muita memória, enquanto a engenharia de prompts precisa apenas de entrada de texto, tornando-a muito mais amigável em termos de recursos.
Custo-benefício: Para serviços de IA baseados em nuvem, o finetuning incorre em custos significativos. A engenharia de prompts usa o modelo base, que geralmente é mais barato.
Manter atualizações do modelo: Quando os provedores atualizam os modelos, as versões com finetuning podem precisar de retreinamento. Os prompts geralmente funcionam em todas as versões sem alterações.
Economia de tempo: O finetuning pode levar horas ou até dias. Em contraste, a engenharia de prompts fornece resultados quase instantâneos, permitindo a resolução rápida de problemas.
Necessidades mínimas de dados: O finetuning precisa de dados substanciais rotulados e específicos da tarefa, que podem ser escassos ou caros. A engenharia de prompts funciona com aprendizado few-shot ou até zero-shot.
Flexibilidade e iteração rápida: Experimente rapidamente várias abordagens, ajuste os prompts e veja os resultados imediatos. Essa experimentação rápida é difícil com o finetuning.
Adaptação de domínio: Adapte facilmente os modelos a novos domínios, fornecendo contexto específico do domínio nos prompts, sem retreinamento.
Melhorias na compreensão: A engenharia de prompts é muito mais eficaz do que o finetuning para ajudar os modelos a entender e utilizar melhor o conteúdo externo, como documentos recuperados.
Preserva o conhecimento geral: O finetuning corre o risco de esquecimento catastrófico, onde o modelo perde conhecimento geral. A engenharia de prompts mantém as amplas capacidades do modelo.
Transparência: Os prompts são legíveis por humanos, mostrando exatamente quais informações o modelo recebe. Essa transparência ajuda na compreensão e depuração.
As páginas de engenharia de prompts nesta seção foram organizadas das técnicas mais amplamente eficazes para as técnicas mais especializadas. Ao solucionar problemas de desempenho, sugerimos que você experimente essas técnicas em ordem, embora o impacto real de cada técnica dependa do seu caso de uso.