Modelos de pensamento estendido
Todos os modelos Opus e Sonnet lançados após o Claude Sonnet 3.7 suportam modos de pensamento padrão e estendido. No modo padrão, esses modelos operam de forma semelhante aos modelos Claude anteriores. No modo de pensamento estendido, o Claude mostrará seu pensamento antes de fornecer sua resposta, permitindo que você tenha uma visão do seu processo de raciocínio.
Visão geral do pensamento estendido
Os modelos de pensamento estendido operam em dois modos:
- Modo padrão: Semelhante aos modelos Claude anteriores, fornecendo respostas diretas sem mostrar o raciocínio interno
- Modo de pensamento estendido: Mostra o processo de raciocínio do Claude antes de entregar a resposta final
Quando usar o modo padrão
O modo padrão funciona bem para a maioria dos casos de uso gerais, incluindo:
- Geração de conteúdo geral
- Assistência básica de codificação
- Tarefas agênticas de rotina
- Orientação para uso de computador
- A maioria das aplicações conversacionais
Quando usar o modo de pensamento estendido
O modo de pensamento estendido se destaca nestas áreas-chave:
- Análise complexa: Análise financeira, jurídica ou de dados envolvendo múltiplos parâmetros e fatores
- Problemas avançados de STEM: Matemática, física, pesquisa e desenvolvimento
- Manipulação de contexto longo: Processamento e síntese de informações de entradas extensas
- Otimização de restrições: Problemas com múltiplos requisitos concorrentes
- Geração detalhada de dados: Criação de tabelas abrangentes ou conjuntos de informações estruturadas
- Seguimento de instruções complexas: Chatbots com prompts de sistema intrincados e muitos fatores a considerar
- Tarefas criativas estruturadas: Escrita criativa que requer planejamento detalhado, esboços ou gerenciamento de múltiplos elementos narrativos
Para saber mais sobre como o pensamento estendido funciona, consulte Pensamento estendido.
Começando com modelos de pensamento estendido
Se você está experimentando o pensamento estendido pela primeira vez, aqui estão algumas dicas:
- Comece com o modo padrão: Comece usando seu modelo Opus ou Sonnet escolhido sem pensamento estendido para estabelecer um desempenho de referência
- Identifique oportunidades de melhoria: Tente ativar o modo de pensamento estendido com um orçamento baixo para ver se seu caso de uso se beneficiaria de um raciocínio mais profundo. Pode ser o caso de que seu uso se beneficiaria mais de prompts mais detalhados no modo padrão do que do pensamento estendido do Claude.
- Implementação gradual: Se necessário, aumente incrementalmente o orçamento de pensamento enquanto testa o desempenho em relação aos seus requisitos.
- Otimize o uso de tokens: Uma vez que você alcance um desempenho aceitável, defina limites apropriados de tokens para gerenciar custos.
- Explore novas possibilidades: Nossos mais recentes modelos Opus e Sonnet, com e sem pensamento estendido, são mais capazes do que os modelos Claude anteriores em uma variedade de domínios. Encorajamos você a experimentar esses modelos para casos de uso onde você anteriormente experimentou limitações com outros modelos.
Construindo com modelos de pensamento estendido
Informações gerais do modelo
Para preços, tamanho da janela de contexto e outras informações sobre todos os modelos Claude atuais com suporte a pensamento estendido, consulte Visão geral de todos os modelos.
Alterações em max tokens e janela de contexto com modelos de pensamento estendido
Em modelos Claude mais antigos (anteriores aos modelos de pensamento estendido), se a soma dos tokens do prompt e max_tokens
excedesse a janela de contexto do modelo, o sistema ajustaria automaticamente max_tokens
para caber dentro do limite de contexto. Isso significava que você poderia definir um valor grande para max_tokens
e o sistema o reduziria silenciosamente conforme necessário.
Com modelos de pensamento estendido, max_tokens
(que inclui seu orçamento de pensamento quando o pensamento está ativado) é aplicado como um limite estrito. O sistema agora retornará um erro de validação se os tokens do prompt + max_tokens
excederem o tamanho da janela de contexto.
Migrando para modelos de pensamento estendido a partir de modelos mais antigos
Se você está transferindo prompts de outro modelo, seja outro modelo Claude ou de outro provedor de modelo, aqui estão algumas dicas:
Migração do modo padrão
- Simplifique seus prompts: Os modelos de pensamento estendido requerem menos direcionamento. Remova qualquer linguagem de orientação específica do modelo que você tenha usado com versões anteriores, como linguagem sobre como lidar com verbosidade - essa linguagem provavelmente é desnecessária e economizará tokens e reduzirá custos.
De outra forma, geralmente não são necessárias alterações no prompt se você estiver usando esses modelos com o pensamento estendido desativado. Se encontrar problemas, aplique as melhores práticas gerais de engenharia de prompt.
Migração do modo de pensamento estendido
Ao usar o pensamento estendido, comece removendo todas as orientações de cadeia de pensamento (CoT) de seus prompts. Os modelos de pensamento estendido são projetados para funcionar efetivamente sem instruções explícitas de raciocínio.
- Em vez de prescrever padrões de pensamento, observe primeiro o processo de pensamento natural do Claude e, em seguida, ajuste seus prompts com base no que você vê.
- Se você quiser fornecer orientação de pensamento, pode incluir orientações em linguagem natural em seu prompt e o Claude será capaz de generalizar tais instruções em seu próprio pensamento.
- Para mais dicas sobre como fazer prompts para pensamento estendido, consulte Dicas de pensamento estendido.
Migrando de outros provedores de modelos
Os modelos de pensamento estendido do Claude podem responder de maneira diferente a padrões de prompt otimizados para modelos de outros provedores. Recomendamos focar em instruções claras e diretas em vez de técnicas de prompt específicas do provedor. Remover tais instruções adaptadas para provedores de modelos específicos pode levar a um melhor desempenho, já que o Claude geralmente é bom em seguir instruções complexas por padrão.
Você pode usar nosso aprimorador de prompt otimizado em console.anthropic.com para obter assistência na migração de prompts.