Este guia fornece estratégias e técnicas avançadas para obter o máximo dos recursos de pensamento estendido do Claude. O pensamento estendido permite que o Claude trabalhe em problemas complexos passo a passo, melhorando o desempenho em tarefas difíceis.

Veja Modelos de pensamento estendido para orientações sobre quando usar o pensamento estendido.

Antes de começar

Este guia pressupõe que você já decidiu usar o modo de pensamento estendido e revisou nossos passos básicos sobre como começar com o pensamento estendido, bem como nosso guia de implementação de pensamento estendido.

Considerações técnicas para o pensamento estendido

  • Os tokens de pensamento têm um orçamento mínimo de 1024 tokens. Recomendamos que você comece com o orçamento mínimo de pensamento e aumente incrementalmente para ajustar com base em suas necessidades e na complexidade da tarefa.
  • Para cargas de trabalho onde o orçamento ideal de pensamento está acima de 32K, recomendamos que você use processamento em lote para evitar problemas de rede. Solicitações que levam o modelo a pensar acima de 32K tokens causam requisições de longa duração que podem esbarrar em limites de tempo do sistema e limites de conexão aberta.
  • O pensamento estendido tem melhor desempenho em inglês, embora as saídas finais possam ser em qualquer idioma que o Claude suporte.
  • Se você precisar de pensamento abaixo do orçamento mínimo, recomendamos usar o modo padrão, com o pensamento desativado, com o tradicional encadeamento de pensamento com tags XML (como <thinking>). Veja encadeamento de pensamento.

Técnicas de prompt para pensamento estendido

Use instruções gerais primeiro, depois solucione problemas com instruções mais detalhadas passo a passo

Claude geralmente tem melhor desempenho com instruções de alto nível para pensar profundamente sobre uma tarefa, em vez de orientações prescritivas passo a passo. A criatividade do modelo na abordagem de problemas pode exceder a capacidade humana de prescrever o processo de pensamento ideal.

Por exemplo, em vez de:

Pense neste problema matemático passo a passo:
1. Primeiro, identifique as variáveis
2. Depois, configure a equação
3. Em seguida, resolva para x
...

Considere:

Por favor, pense sobre este problema matemático de forma completa e em grande detalhe.
Considere múltiplas abordagens e mostre seu raciocínio completo.
Tente métodos diferentes se sua primeira abordagem não funcionar.

Dito isso, o Claude ainda pode seguir efetivamente etapas de execução estruturadas complexas quando necessário. O modelo pode lidar com listas ainda mais longas com instruções mais complexas do que as versões anteriores. Recomendamos que você comece com instruções mais generalizadas, depois leia a saída de pensamento do Claude e itere para fornecer instruções mais específicas para orientar seu pensamento a partir daí.

Prompting multishot com pensamento estendido

O prompting multishot funciona bem com o pensamento estendido. Quando você fornece ao Claude exemplos de como pensar sobre problemas, ele seguirá padrões de raciocínio semelhantes dentro de seus blocos de pensamento estendido.

Você pode incluir exemplos de poucos disparos (few-shot) em seu prompt em cenários de pensamento estendido usando tags XML como <thinking> ou <scratchpad> para indicar padrões canônicos de pensamento estendido nesses exemplos.

O Claude generalizará o padrão para o processo formal de pensamento estendido. No entanto, é possível que você obtenha melhores resultados dando ao Claude liberdade para pensar da maneira que considerar melhor.

Exemplo:

Vou mostrar como resolver um problema matemático, depois quero que você resolva um semelhante.

Problema 1: Quanto é 15% de 80?

<thinking>
Para encontrar 15% de 80:
1. Converta 15% para decimal: 15% = 0,15
2. Multiplique: 0,15 × 80 = 12
</thinking>

A resposta é 12.

Agora resolva este:
Problema 2: Quanto é 35% de 240?

Maximizando o seguimento de instruções com pensamento estendido

Claude mostra um seguimento de instruções significativamente melhorado quando o pensamento estendido está ativado. O modelo tipicamente:

  1. Raciocina sobre as instruções dentro do bloco de pensamento estendido
  2. Executa essas instruções na resposta

Para maximizar o seguimento de instruções:

  • Seja claro e específico sobre o que você quer
  • Para instruções complexas, considere dividi-las em etapas numeradas que o Claude deve trabalhar metodicamente
  • Permita que o Claude tenha orçamento suficiente para processar completamente as instruções em seu pensamento estendido

Usando o pensamento estendido para depurar e orientar o comportamento do Claude

Você pode usar a saída de pensamento do Claude para depurar a lógica do Claude, embora este método nem sempre seja perfeitamente confiável.

Para fazer o melhor uso desta metodologia, recomendamos as seguintes dicas:

  • Não recomendamos passar o pensamento estendido do Claude de volta no bloco de texto do usuário, pois isso não melhora o desempenho e pode realmente degradar os resultados.
  • O preenchimento prévio do pensamento estendido é explicitamente não permitido, e alterar manualmente o texto de saída do modelo que segue seu bloco de pensamento provavelmente degradará os resultados devido à confusão do modelo.

Quando o pensamento estendido está desativado, o preenchimento prévio padrão do texto de resposta do assistant ainda é permitido.

Às vezes, o Claude pode repetir seu pensamento estendido no texto de saída do assistente. Se você quiser uma resposta limpa, instrua o Claude a não repetir seu pensamento estendido e a produzir apenas a resposta.

Aproveitando ao máximo saídas longas e pensamento de longa duração

Para casos de uso de geração de conjuntos de dados, experimente prompts como “Por favor, crie uma tabela extremamente detalhada de…” para gerar conjuntos de dados abrangentes.

Para casos de uso como geração de conteúdo detalhado, onde você pode querer gerar blocos de pensamento estendido mais longos e respostas mais detalhadas, experimente estas dicas:

  • Aumente tanto o comprimento máximo do pensamento estendido QUANTO peça explicitamente por saídas mais longas
  • Para saídas muito longas (mais de 20.000 palavras), solicite um esboço detalhado com contagens de palavras até o nível do parágrafo. Em seguida, peça ao Claude para indexar seus parágrafos ao esboço e manter as contagens de palavras especificadas

Não recomendamos que você force o Claude a produzir mais tokens apenas por produzir tokens. Em vez disso, incentivamos você a começar com um pequeno orçamento de pensamento e aumentar conforme necessário para encontrar as configurações ideais para seu caso de uso.

Aqui estão exemplos de casos de uso onde o Claude se destaca devido ao pensamento estendido mais longo:

Peça ao Claude para refletir e verificar seu trabalho para melhorar a consistência e o tratamento de erros

Você pode usar prompts em linguagem natural simples para melhorar a consistência e reduzir erros:

  1. Peça ao Claude para verificar seu trabalho com um teste simples antes de declarar uma tarefa completa
  2. Instrua o modelo a analisar se sua etapa anterior alcançou o resultado esperado
  3. Para tarefas de codificação, peça ao Claude para executar casos de teste em seu pensamento estendido

Exemplo:

Escreva uma função para calcular o fatorial de um número.
Antes de terminar, por favor, verifique sua solução com casos de teste para:
- n=0
- n=1
- n=5
- n=10
E corrija quaisquer problemas que encontrar.

Próximos passos