Modelos de pensamento estendido
O Claude 3.7 Sonnet é um modelo híbrido capaz de operar tanto no modo de pensamento padrão quanto no modo de pensamento estendido. No modo padrão, o Claude 3.7 Sonnet opera de forma semelhante a outros modelos da família Claude 3. No modo de pensamento estendido, o Claude mostrará seu pensamento antes de fornecer sua resposta, permitindo que você compreenda seu processo de raciocínio.
Visão geral do Claude 3.7
O Claude 3.7 Sonnet opera em dois modos:
- Modo padrão: Similar aos modelos Claude anteriores, fornecendo respostas diretas sem mostrar o raciocínio interno
- Modo de pensamento estendido: Mostra o processo de raciocínio do Claude antes de entregar a resposta final
Quando usar o modo padrão
O modo padrão funciona bem para a maioria dos casos de uso gerais, incluindo:
- Geração de conteúdo geral
- Assistência básica em programação
- Tarefas agênticas de rotina
- Orientação no uso do computador
- Maioria das aplicações conversacionais
Quando usar o modo de pensamento estendido
O modo de pensamento estendido se destaca nestas áreas principais:
- Análise complexa: Análise financeira, jurídica ou de dados envolvendo múltiplos parâmetros e fatores
- Problemas avançados de STEM: Matemática, física, pesquisa e desenvolvimento
- Manipulação de contexto longo: Processamento e síntese de informações de entradas extensas
- Otimização de restrições: Problemas com múltiplos requisitos concorrentes
- Geração detalhada de dados: Criação de tabelas abrangentes ou conjuntos de informações estruturadas
- Seguimento de instruções complexas: Chatbots com prompts de sistema intrincados e muitos fatores a considerar
- Tarefas criativas estruturadas: Escrita criativa que requer planejamento detalhado, esboços ou gerenciamento de múltiplos elementos narrativos
Para saber mais sobre como funciona o pensamento estendido, consulte Pensamento estendido.
Começando com o Claude 3.7 Sonnet
Se você está experimentando o Claude 3.7 Sonnet pela primeira vez, aqui estão algumas dicas:
- Comece com o modo padrão: Comece usando o Claude 3.7 Sonnet sem pensamento estendido para estabelecer um desempenho base
- Identifique oportunidades de melhoria: Tente ativar o modo de pensamento estendido com um orçamento baixo para ver se seu caso de uso se beneficiaria de um raciocínio mais profundo. Pode ser que seu caso de uso se beneficie mais de prompts mais detalhados no modo padrão do que do pensamento estendido do Claude.
- Implementação gradual: Se necessário, aumente incrementalmente o orçamento de pensamento enquanto testa o desempenho em relação aos seus requisitos.
- Otimize o uso de tokens: Uma vez que você alcance um desempenho aceitável, defina limites apropriados de tokens para gerenciar custos.
- Explore novas possibilidades: O Claude 3.7 Sonnet, com e sem pensamento estendido, é mais capaz que os modelos Claude anteriores em uma variedade de domínios. Encorajamos você a experimentar o Claude 3.7 Sonnet para casos de uso onde você anteriormente experimentou limitações com outros modelos.
Construindo com o Claude 3.7 Sonnet
Informações gerais do modelo
Para preços, tamanho da janela de contexto e outras informações sobre o Claude 3.7 Sonnet e todos os outros modelos Claude atuais, consulte Visão geral de todos os modelos.
Alterações nos tokens máximos e janela de contexto com o Claude 3.7 Sonnet
Em modelos Claude mais antigos (anteriores ao Claude 3.7 Sonnet), se a soma dos tokens do prompt e max_tokens
excedesse a janela de contexto do modelo, o sistema ajustaria automaticamente max_tokens
para caber dentro do limite de contexto. Isso significava que você poderia definir um valor grande de max_tokens
e o sistema o reduziria silenciosamente conforme necessário.
Com o Claude 3.7 Sonnet, max_tokens
(que inclui seu orçamento de pensamento quando o pensamento está ativado) é aplicado como um limite estrito. O sistema agora retornará um erro de validação se os tokens do prompt + max_tokens
excederem o tamanho da janela de contexto.
Capacidades de saída estendida (beta)
O Claude 3.7 Sonnet também pode produzir respostas substancialmente mais longas do que os modelos anteriores, com suporte para até 128K tokens de saída (beta)—mais de 15x mais longo que outros modelos Claude. Esta capacidade expandida é particularmente efetiva para casos de uso de pensamento estendido envolvendo raciocínio complexo, geração rica de código e criação abrangente de conteúdo.
Este recurso pode ser ativado passando um cabeçalho anthropic-beta
de output-128k-2025-02-19
.
Ao usar o pensamento estendido com saídas mais longas, você pode alocar um orçamento de pensamento maior para suportar um raciocínio mais completo, mantendo ainda tokens amplos disponíveis para a resposta final.
Migrando para o Claude 3.7 Sonnet de outros modelos
Se você está transferindo prompts de outro modelo, seja outro modelo Claude ou de outro provedor de modelo, aqui estão algumas dicas:
Migração do modo padrão
- Simplifique seus prompts: O Claude 3.7 Sonnet requer menos direcionamento. Remova qualquer linguagem de orientação específica do modelo que você tenha usado com versões anteriores, como linguagem sobre o tratamento de verbosidade - essa linguagem provavelmente é desnecessária e economizará tokens e reduzirá custos.
De outra forma, geralmente não são necessárias alterações no prompt se você estiver usando o Claude 3.7 Sonnet com o pensamento estendido desativado. Se encontrar problemas, aplique as melhores práticas gerais de engenharia de prompt.
Migração do modo de pensamento estendido
Ao usar o pensamento estendido, comece removendo todas as orientações de cadeia de pensamento (CoT) de seus prompts. A capacidade de pensamento do Claude 3.7 Sonnet foi projetada para funcionar efetivamente sem instruções explícitas de raciocínio.
- Em vez de prescrever padrões de pensamento, observe primeiro o processo natural de pensamento do Claude e depois ajuste seus prompts com base no que você vê.
- Se você quiser fornecer orientação de pensamento, pode incluir orientações em linguagem natural em seu prompt e o Claude será capaz de generalizar tais instruções em seu próprio pensamento.
- Para mais dicas sobre como fazer prompts para pensamento estendido, consulte Dicas de pensamento estendido.
Migrando de outros provedores de modelo
O Claude 3.7 Sonnet pode responder diferentemente a padrões de prompt otimizados para modelos de outros provedores. Recomendamos focar em instruções claras e diretas em vez de técnicas de prompt específicas do provedor. Remover tais instruções adaptadas para provedores de modelo específicos pode levar a um melhor desempenho, já que o Claude geralmente é bom em seguir instruções complexas por padrão.
Você pode usar nosso otimizador de prompt aprimorado em console.anthropic.com para assistência na migração de prompts.
Próximos passos
Was this page helpful?