Resumo jurídico
Este guia explica como aproveitar as capacidades avançadas de processamento de linguagem natural do Claude para resumir documentos jurídicos de forma eficiente, extraindo informações-chave e acelerando a pesquisa jurídica. Com o Claude, você pode otimizar a revisão de contratos, a preparação de litígios e o trabalho regulatório, economizando tempo e garantindo precisão em seus processos jurídicos.
Visite nosso cookbook de resumos para ver um exemplo de implementação de resumo jurídico usando o Claude.
Antes de construir com o Claude
Decida se deve usar o Claude para resumos jurídicos
Aqui estão alguns indicadores-chave de que você deve empregar um LLM como o Claude para resumir documentos jurídicos:
Determine os detalhes que você deseja que o resumo extraia
Não existe um único resumo correto para qualquer documento. Sem uma direção clara, pode ser difícil para o Claude determinar quais detalhes incluir. Para obter resultados ideais, identifique as informações específicas que você deseja incluir no resumo.
Por exemplo, ao resumir um contrato de sublocação, você pode querer extrair os seguintes pontos-chave:
Estabeleça critérios de sucesso
Avaliar a qualidade dos resumos é uma tarefa notoriamente desafiadora. Diferentemente de muitas outras tarefas de processamento de linguagem natural, a avaliação de resumos geralmente carece de métricas objetivas claras. O processo pode ser altamente subjetivo, com diferentes leitores valorizando diferentes aspectos de um resumo. Aqui estão critérios que você pode considerar ao avaliar o desempenho do Claude na resumo jurídico.
Veja nosso guia sobre estabelecimento de critérios de sucesso para mais informações.
Como resumir documentos jurídicos usando o Claude
Selecione o modelo Claude correto
A precisão do modelo é extremamente importante ao resumir documentos jurídicos. O Claude Sonnet 3.5 é uma excelente escolha para casos de uso como este, onde alta precisão é necessária. Se o tamanho e a quantidade de seus documentos forem grandes, a ponto de os custos começarem a se tornar uma preocupação, você também pode tentar usar um modelo menor como o Claude Haiku 3.
Para ajudar a estimar esses custos, abaixo está uma comparação do custo para resumir 1.000 contratos de sublocação usando tanto o Sonnet quanto o Haiku:
-
Tamanho do conteúdo
- Número de contratos: 1.000
- Caracteres por contrato: 300.000
- Total de caracteres: 300M
-
Tokens estimados
- Tokens de entrada: 86M (assumindo 1 token por 3,5 caracteres)
- Tokens de saída por resumo: 350
- Total de tokens de saída: 350.000
-
Custo estimado do Claude Sonnet 4
- Custo de tokens de entrada: 86 MTok * $3,00/MTok = $258
- Custo de tokens de saída: 0,35 MTok * $15,00/MTok = $5,25
- Custo total: $258,00 + $5,25 = $263,25
-
Custo estimado do Claude Haiku 3
- Custo de tokens de entrada: 86 MTok * $0,25/MTok = $21,50
- Custo de tokens de saída: 0,35 MTok * $1,25/MTok = $0,44
- Custo total: $21,50 + $0,44 = $21,96
Transforme documentos em um formato que o Claude possa processar
Antes de começar a resumir documentos, você precisa preparar seus dados. Isso envolve extrair texto de PDFs, limpar o texto e garantir que ele esteja pronto para ser processado pelo Claude.
Aqui está uma demonstração desse processo em um PDF de exemplo:
Neste exemplo, primeiro baixamos um PDF de um contrato de sublocação de exemplo usado no cookbook de resumos. Este contrato foi obtido de um contrato de sublocação publicamente disponível no site sec.gov.
Usamos a biblioteca pypdf para extrair o conteúdo do PDF e convertê-lo em texto. Os dados de texto são então limpos, removendo espaços em branco extras e números de página.
Construa um prompt forte
O Claude pode se adaptar a vários estilos de resumo. Você pode alterar os detalhes do prompt para orientar o Claude a ser mais ou menos verboso, incluir mais ou menos terminologia técnica, ou fornecer um resumo de nível mais alto ou mais baixo do contexto em questão.
Aqui está um exemplo de como criar um prompt que garanta que os resumos gerados sigam uma estrutura consistente ao analisar contratos de sublocação:
Este código implementa uma função summarize_document
que usa o Claude para resumir o conteúdo de um contrato de sublocação. A função aceita uma string de texto e uma lista de detalhes a serem extraídos como entradas. Neste exemplo, chamamos a função com as variáveis document_text
e details_to_extract
que foram definidas nos trechos de código anteriores.
Dentro da função, um prompt é gerado para o Claude, incluindo o documento a ser resumido, os detalhes a serem extraídos e instruções específicas para resumir o documento. O prompt instrui o Claude a responder com um resumo de cada detalhe a ser extraído, aninhado dentro de cabeçalhos XML.
Como decidimos exibir cada seção do resumo dentro de tags, cada seção pode ser facilmente analisada como uma etapa de pós-processamento. Essa abordagem permite resumos estruturados que podem ser adaptados para seu caso de uso, de modo que cada resumo siga o mesmo padrão.
Avalie seu prompt
O prompting geralmente requer testes e otimização para estar pronto para produção. Para determinar a prontidão da sua solução, avalie a qualidade dos seus resumos usando um processo sistemático que combine métodos quantitativos e qualitativos. Criar uma avaliação empírica forte baseada em seus critérios de sucesso definidos permitirá otimizar seus prompts. Aqui estão algumas métricas que você pode desejar incluir em sua avaliação empírica:
Implante seu prompt
Aqui estão algumas considerações adicionais a serem lembradas ao implantar sua solução em produção.
-
Garanta ausência de responsabilidade: Entenda as implicações legais de erros nos resumos, que poderiam levar a responsabilidade legal para sua organização ou clientes. Forneça avisos legais ou notificações esclarecendo que os resumos são gerados por IA e devem ser revisados por profissionais jurídicos.
-
Lide com diversos tipos de documentos: Neste guia, discutimos como extrair texto de PDFs. No mundo real, os documentos podem vir em uma variedade de formatos (PDFs, documentos Word, arquivos de texto, etc.). Certifique-se de que seu pipeline de extração de dados possa converter todos os formatos de arquivo que você espera receber.
-
Paralelize chamadas de API para o Claude: Documentos longos com um grande número de tokens podem exigir até um minuto para que o Claude gere um resumo. Para grandes coleções de documentos, você pode querer enviar chamadas de API para o Claude em paralelo para que os resumos possam ser concluídos em um prazo razoável. Consulte os limites de taxa da Anthropic para determinar o número máximo de chamadas de API que podem ser realizadas em paralelo.
Melhore o desempenho
Em cenários complexos, pode ser útil considerar estratégias adicionais para melhorar o desempenho além das técnicas padrão de engenharia de prompt. Aqui estão algumas estratégias avançadas:
Realize meta-resumo para resumir documentos longos
O resumo jurídico frequentemente envolve o manuseio de documentos longos ou muitos documentos relacionados de uma vez, de modo que você ultrapassa a janela de contexto do Claude. Você pode usar um método de fragmentação conhecido como meta-resumo para lidar com este caso de uso. Esta técnica envolve dividir documentos em partes menores e gerenciáveis e, em seguida, processar cada parte separadamente. Você pode então combinar os resumos de cada parte para criar um meta-resumo de todo o documento.
Aqui está um exemplo de como realizar meta-resumo:
A função summarize_long_document
se baseia na função anterior summarize_document
, dividindo o documento em partes menores e resumindo cada parte individualmente.
O código alcança isso aplicando a função summarize_document
a cada fragmento de 20.000 caracteres dentro do documento original. Os resumos individuais são então combinados, e um resumo final é criado a partir desses resumos de fragmentos.
Observe que a função summarize_long_document
não é estritamente necessária para nosso exemplo de PDF, pois o documento inteiro cabe na janela de contexto do Claude. No entanto, ela se torna essencial para documentos que excedem a janela de contexto do Claude ou ao resumir vários documentos relacionados juntos. Independentemente disso, essa técnica de meta-resumo geralmente captura detalhes importantes adicionais no resumo final que foram perdidos na abordagem anterior de resumo único.
Use documentos indexados por resumo para explorar uma grande coleção de documentos
Pesquisar uma coleção de documentos com um LLM geralmente envolve geração aumentada por recuperação (RAG). No entanto, em cenários envolvendo documentos grandes ou quando a recuperação precisa de informações é crucial, uma abordagem RAG básica pode ser insuficiente. Documentos indexados por resumo é uma abordagem RAG avançada que fornece uma maneira mais eficiente de classificar documentos para recuperação, usando menos contexto do que os métodos RAG tradicionais. Nessa abordagem, você primeiro usa o Claude para gerar um resumo conciso para cada documento em seu corpus e, em seguida, usa o Clade para classificar a relevância de cada resumo para a consulta sendo feita. Para mais detalhes sobre essa abordagem, incluindo um exemplo baseado em código, confira a seção de documentos indexados por resumo no cookbook de resumos.
Fine-tune o Claude para aprender com seu conjunto de dados
Outra técnica avançada para melhorar a capacidade do Claude de gerar resumos é o fine-tuning. O fine-tuning envolve treinar o Claude em um conjunto de dados personalizado que se alinha especificamente com suas necessidades de resumo jurídico, garantindo que o Claude se adapte ao seu caso de uso. Aqui está uma visão geral de como realizar o fine-tuning:
-
Identifique erros: Comece coletando instâncias onde os resumos do Claude ficam aquém - isso pode incluir a falta de detalhes jurídicos críticos, mal-entendidos de contexto ou o uso de terminologia jurídica inadequada.
-
Organize um conjunto de dados: Uma vez que você tenha identificado esses problemas, compile um conjunto de dados desses exemplos problemáticos. Este conjunto de dados deve incluir os documentos jurídicos originais juntamente com seus resumos corrigidos, garantindo que o Claude aprenda o comportamento desejado.
-
Realize o fine-tuning: O fine-tuning envolve retreinar o modelo em seu conjunto de dados organizado para ajustar seus pesos e parâmetros. Este retreinamento ajuda o Claude a entender melhor os requisitos específicos do seu domínio jurídico, melhorando sua capacidade de resumir documentos de acordo com seus padrões.
-
Melhoria iterativa: O fine-tuning não é um processo único. À medida que o Claude continua a gerar resumos, você pode iterativamente adicionar novos exemplos onde ele teve desempenho insatisfatório, refinando ainda mais suas capacidades. Com o tempo, este ciclo contínuo de feedback resultará em um modelo altamente especializado para suas tarefas de resumo jurídico.