Este guia fornece estratégias e técnicas avançadas para obter o máximo dos recursos de pensamento estendido do Claude. O pensamento estendido permite que o Claude trabalhe através de problemas complexos passo a passo, melhorando o desempenho em tarefas difíceis. Veja Modelos de pensamento estendido para orientação sobre quando usar o pensamento estendido.

Antes de mergulhar

Este guia pressupõe que você já decidiu usar o modo de pensamento estendido e revisou nossos passos básicos sobre como começar com o pensamento estendido bem como nosso guia de implementação de pensamento estendido.

Considerações técnicas para o pensamento estendido

  • Os tokens de pensamento têm um orçamento mínimo de 1024 tokens. Recomendamos que você comece com o orçamento mínimo de pensamento e aumente incrementalmente para ajustar com base em suas necessidades e complexidade da tarefa.
  • Para cargas de trabalho onde o orçamento ideal de pensamento está acima de 32K, recomendamos que você use processamento em lote para evitar problemas de rede. Solicitações que empurram o modelo a pensar acima de 32K tokens causam solicitações de longa duração que podem esbarrar em timeouts do sistema e limites de conexão aberta.
  • O pensamento estendido funciona melhor em inglês, embora as saídas finais possam estar em qualquer idioma que o Claude suporte.
  • Se você precisar de pensamento abaixo do orçamento mínimo, recomendamos usar o modo padrão, com o pensamento desligado, com prompting tradicional de cadeia de pensamento com tags XML (como <thinking>). Veja prompting de cadeia de pensamento.

Técnicas de prompting para pensamento estendido

Use instruções gerais primeiro, depois solucione problemas com instruções mais passo a passo

O Claude frequentemente tem melhor desempenho com instruções de alto nível para apenas pensar profundamente sobre uma tarefa em vez de orientação prescritiva passo a passo. A criatividade do modelo na abordagem de problemas pode exceder a capacidade humana de prescrever o processo de pensamento ideal. Por exemplo, em vez de:
Pense através deste problema de matemática passo a passo:
1. Primeiro, identifique as variáveis
2. Então, configure a equação
3. Em seguida, resolva para x
...
Considere:
Por favor, pense sobre este problema de matemática minuciosamente e em grande detalhe.
Considere múltiplas abordagens e mostre seu raciocínio completo.
Tente métodos diferentes se sua primeira abordagem não funcionar.
Dito isso, o Claude ainda pode seguir efetivamente passos de execução estruturados complexos quando necessário. O modelo pode lidar com listas ainda mais longas com instruções mais complexas do que versões anteriores. Recomendamos que você comece com instruções mais generalizadas, então leia a saída de pensamento do Claude e itere para fornecer instruções mais específicas para direcionar seu pensamento a partir daí.

Prompting multishot com pensamento estendido

Prompting multishot funciona bem com pensamento estendido. Quando você fornece ao Claude exemplos de como pensar através de problemas, ele seguirá padrões de raciocínio similares dentro de seus blocos de pensamento estendido. Você pode incluir exemplos few-shot em seu prompt em cenários de pensamento estendido usando tags XML como <thinking> ou <scratchpad> para indicar padrões canônicos de pensamento estendido nesses exemplos. O Claude generalizará o padrão para o processo formal de pensamento estendido. No entanto, é possível que você obtenha melhores resultados dando ao Claude rédea solta para pensar da maneira que ele julgar melhor. Exemplo:
Vou mostrar como resolver um problema de matemática, então quero que você resolva um similar.

Problema 1: Quanto é 15% de 80?

<thinking>
Para encontrar 15% de 80:
1. Converter 15% para decimal: 15% = 0,15
2. Multiplicar: 0,15 × 80 = 12
</thinking>

A resposta é 12.

Agora resolva este:
Problema 2: Quanto é 35% de 240?

Maximizando o seguimento de instruções com pensamento estendido

O Claude mostra seguimento de instruções significativamente melhorado quando o pensamento estendido está habilitado. O modelo tipicamente:
  1. Raciocina sobre instruções dentro do bloco de pensamento estendido
  2. Executa essas instruções na resposta
Para maximizar o seguimento de instruções:
  • Seja claro e específico sobre o que você quer
  • Para instruções complexas, considere dividi-las em passos numerados que o Claude deve trabalhar metodicamente
  • Permita ao Claude orçamento suficiente para processar as instruções completamente em seu pensamento estendido

Usando pensamento estendido para debugar e direcionar o comportamento do Claude

Você pode usar a saída de pensamento do Claude para debugar a lógica do Claude, embora este método nem sempre seja perfeitamente confiável. Para fazer o melhor uso desta metodologia, recomendamos as seguintes dicas:
  • Não recomendamos passar o pensamento estendido do Claude de volta no bloco de texto do usuário, pois isso não melhora o desempenho e pode realmente degradar os resultados.
  • Pré-preenchimento de pensamento estendido é explicitamente não permitido, e alterar manualmente o texto de saída do modelo que segue seu bloco de pensamento provavelmente vai degradar os resultados devido à confusão do modelo.
Quando o pensamento estendido está desligado, o pré-preenchimento padrão do texto de resposta assistant ainda é permitido.
Às vezes o Claude pode repetir seu pensamento estendido no texto de saída do assistente. Se você quiser uma resposta limpa, instrua o Claude a não repetir seu pensamento estendido e apenas produzir a resposta.

Aproveitando ao máximo saídas longas e pensamento de forma longa

Para casos de uso de geração de conjuntos de dados, tente prompts como “Por favor, crie uma tabela extremamente detalhada de…” para gerar conjuntos de dados abrangentes. Para casos de uso como geração de conteúdo detalhado onde você pode querer gerar blocos de pensamento estendido mais longos e respostas mais detalhadas, tente estas dicas:
  • Aumente tanto o comprimento máximo de pensamento estendido E explicitamente peça por saídas mais longas
  • Para saídas muito longas (20.000+ palavras), solicite um esboço detalhado com contagens de palavras até o nível do parágrafo. Então peça ao Claude para indexar seus parágrafos ao esboço e manter as contagens de palavras especificadas
Não recomendamos que você empurre o Claude a produzir mais tokens pelo bem de produzir tokens. Em vez disso, encorajamos você a começar com um pequeno orçamento de pensamento e aumentar conforme necessário para encontrar as configurações ideais para seu caso de uso.
Aqui estão casos de uso de exemplo onde o Claude se destaca devido ao pensamento estendido mais longo:

Faça o Claude refletir e verificar seu trabalho para melhor consistência e tratamento de erros

Você pode usar prompting em linguagem natural simples para melhorar a consistência e reduzir erros:
  1. Peça ao Claude para verificar seu trabalho com um teste simples antes de declarar uma tarefa completa
  2. Instrua o modelo a analisar se seu passo anterior alcançou o resultado esperado
  3. Para tarefas de codificação, peça ao Claude para executar casos de teste em seu pensamento estendido
Exemplo:
Escreva uma função para calcular o fatorial de um número.
Antes de terminar, por favor verifique sua solução com casos de teste para:
- n=0
- n=1
- n=5
- n=10
E corrija quaisquer problemas que encontrar.

Próximos passos