Guia do modelo legado
Embora recomendemos fortemente a atualização para a família de modelos Claude 3 devido ao seu desempenho superior, capacidades de visão e inteligência geral (consulte a página visão geral dos modelos para obter mais informações), entendemos que a transição leva tempo e alguns usuários podem precisar continuar trabalhando com nossos modelos legados por mais um tempo.
Este guia tem como objetivo fornecer dicas de uso para nossos modelos legados, bem como dicas sobre como migrar seus prompts de outros modelos, como o GPT da OpenAI, para nossos modelos legados (para migração para nossos modelos de fronteira, consulte nosso guia principal de migração).
Modelos legados da Anthropic
Nossos modelos legados incluem Claude Instant 1.2, Claude 2.0 e Claude 2.1. Desses modelos legados, o Claude 2.1 é o único modelo com suporte a prompt de sistema (todos os modelos Claude 3 têm suporte completo a prompt de sistema).
Esses modelos não possuem os recursos de visão da família Claude 3 e geralmente têm desempenho e inteligência inferiores. No entanto, eles ainda podem ser úteis para determinados aplicativos que não exigem os recursos avançados dos modelos Claude 3. Consulte a página visão geral dos modelos para obter um resumo completo.
Observe que os modelos legados podem ser descontinuados ao longo do tempo e têm menos suporte do que os modelos mais recentes, portanto, recomendamos planejar uma migração para a família Claude 3, se possível.
Migrando prompts do OpenAI/ChatGPT para modelos legados do Claude
Se você estiver fazendo a transição dos modelos GPT da OpenAI ou do ChatGPT para a família de modelos Claude 2 ou mais antigos, provavelmente precisará fazer alguns ajustes em seus prompts para garantir o desempenho ideal. Embora a família Claude 3 seja muito mais direcionável e geralmente possa lidar com migrações de prompt sem a necessidade de modificação, os modelos legados podem exigir ajustes adicionais de prompt. (Dito isso, embora não seja necessário, essas mesmas técnicas e outras estratégias de engenharia de prompt ainda podem ser úteis para melhorar o desempenho do modelo Claude 3 além de sua linha de base.)
Aqui estão algumas dicas para ajudá-lo a converter seus prompts GPT para obter melhores resultados com os modelos legados do Claude:
1. Adicione tags XML
As tags XML (por exemplo, <tag></tag>
) podem ser usadas para demarcar diferentes subseções de um prompt, permitindo que o Claude compartimente o prompt em partes distintas. Por exemplo, para adicionar texto de um documento ao seu prompt, envolva o documento em tags <doc></doc>
:
<doc>
Algum trecho de texto...
</doc>
O Claude também pode reconhecer outros formatos estruturados, como JSON e Markdown, mas o XML tende a levar ao melhor desempenho na maioria dos casos devido à exposição durante o treinamento. Você pode usar qualquer nome de tag que desejar, desde que siga o formato <>
e </>
(embora recomendemos que os nomes das tags sejam um pouco sensatos e semanticamente conectados ao conteúdo que estão demarcando). Para obter mais informações, consulte nosso guia sobre como usar tags XML.
2. Forneça instruções claras e inequívocas
O Claude responde bem a instruções claras e diretas. Em vez de deixar espaço para suposições implícitas, instrua explicitamente o Claude com o máximo de detalhes possível dentro do seu prompt para garantir que ele possa executar totalmente a tarefa em questão de acordo com suas especificações. Por exemplo, em vez de:
Função | Conteúdo |
---|---|
User | Use o contexto e a pergunta para criar uma resposta. |
Tente:
Função | Conteúdo |
---|---|
User | Por favor, leia a pergunta do usuário fornecida dentro das tags <question>. Em seguida, usando apenas as informações contextuais fornecidas acima dentro das tags <context>, gere uma resposta para a pergunta e exiba-a dentro das tags <answer>. |
Ao criar prompts para o Claude, adote a mentalidade de que ele é novo na tarefa e não tem nenhum contexto prévio além do que está declarado no prompt. Fornecer explicações detalhadas e inequívocas ajudará o Claude a gerar melhores respostas. Para obter mais informações, consulte seja claro e direto.
3. Preencha previamente a resposta do Claude
Você pode estender o prompt do Claude para preencher previamente a vez do Assistant
. O Claude continuará a conversa a partir do último token na mensagem do Assistant
. Isso pode ajudar a evitar as tendências de conversa do Claude e garantir que ele forneça o formato de saída desejado. Por exemplo:
Função | Conteúdo |
---|---|
User | Gostaria que você reescrevesse o seguinte parágrafo usando as seguintes instruções: ” {{INSTRUCTIONS}}“. Aqui está o parágrafo: <text>“{{PARAGRAPH}}”</text> Por favor, exiba sua reescrita dentro das tags <rewrite></rewrite>. |
Assistant (Prefill) | <rewrite> |
Se você usar essa abordagem, certifique-se de passar </rewrite>
como uma sequência de parada em sua chamada de API. Para obter mais informações, consulte nosso guia sobre preenchimento prévio da resposta do Claude.
4. Mantenha o Claude no personagem
Consulte mantenha o Claude no personagem para obter estratégias para garantir que o Claude mantenha o personagem em cenários de interpretação de papéis. Observe que, para o Claude 2.1 (e todos os modelos Claude 3), você também pode usar um prompt de sistema para ajudar o Claude a permanecer melhor no personagem.
5. Coloque os documentos antes das instruções
A longa janela de contexto do Claude (100K-200K dependendo do modelo) o torna ótimo para analisar documentos longos e sequências de texto. É melhor fornecer documentos longos e texto antes das instruções ou da entrada do usuário, pois o Claude presta atenção extra ao texto próximo à parte inferior do prompt. Certifique-se de enfatizar instruções importantes perto do final de seus prompts.
Consulte dicas de janela de contexto longo para obter mais informações.
6. Adicione muitos exemplos (pelo menos 3)
O Claude aprende bem por meio de exemplos de como deve responder e em que formato. Recomendamos adicionar pelo menos três exemplos ao seu prompt, mas quanto mais, melhor! Os exemplos são especialmente benéficos para tarefas que exigem saídas estruturadas consistentes e confiáveis. Exemplos uniformes ensinarão o Claude a sempre responder da mesma maneira todas as vezes. Saiba mais visitando nosso guia para solicitar com exemplos.
Recursos do modelo legado
O Claude gera ações com asteriscos
Quando recebe um prompt de interpretação de papéis ou um prompt de sistema, os modelos legados do Claude às vezes gostam de ilustrar suas respostas de forma criativa, escrevendo direções de palco como *sorri*
ou *acena*
. Se isso não for desejado, você pode pós-processar a saída para remover palavras entre asteriscos.
Um exemplo de como fazer isso em Python:
import re
text = "Olá. *Meu nome é Claude. *Eu sou um assistente de IA."
cleaned = re.sub(r'\*.*?\*', '', text)
print(cleaned)
> Olá. Eu sou um assistente de IA.