Resumo jurídico

Visite nosso cookbook de resumos para ver um exemplo de implementação de resumo jurídico usando o Claude.

Antes de construir com o Claude

Decida se deve usar o Claude para resumos jurídicos

Aqui estão alguns indicadores-chave de que você deve empregar um LLM como o Claude para resumir documentos jurídicos:

Você quer revisar um alto volume de documentos de forma eficiente e acessível

Você requer extração automatizada de metadados-chave

Você quer gerar resumos claros, concisos e padronizados

Você precisa de citações precisas para seus resumos

Você quer agilizar e acelerar seu processo de pesquisa jurídica

Determine os detalhes que você deseja que o resumo extraia

Não existe um único resumo correto para qualquer documento. Sem uma direção clara, pode ser difícil para o Claude determinar quais detalhes incluir. Para obter resultados ideais, identifique as informações específicas que você deseja incluir no resumo. Por exemplo, ao resumir um contrato de sublocação, você pode querer extrair os seguintes pontos-chave:

details_to_extract = [
    'Partes envolvidas (sublocador, sublocatário e locador original)',
    'Detalhes da propriedade (endereço, descrição e uso permitido)', 
    'Prazo e aluguel (data de início, data de término, aluguel mensal e depósito de segurança)',
    'Responsabilidades (serviços públicos, manutenção e reparos)',
    'Consentimento e notificações (consentimento do proprietário e requisitos de notificação)',
    'Disposições especiais (mobiliário, estacionamento e restrições de sublocação)'
]

Estabeleça critérios de sucesso

Avaliar a qualidade dos resumos é uma tarefa notoriamente desafiadora. Diferentemente de muitas outras tarefas de processamento de linguagem natural, a avaliação de resumos geralmente carece de métricas objetivas claras. O processo pode ser altamente subjetivo, com diferentes leitores valorizando diferentes aspectos de um resumo. Aqui estão critérios que você pode considerar ao avaliar o desempenho do Claude na resumo jurídico.

Correção factual

Precisão jurídica

Concisão

Consistência

Legibilidade

Imparcialidade e equidade

Veja nosso guia sobre estabelecimento de critérios de sucesso para mais informações.

Como resumir documentos jurídicos usando o Claude

Selecione o modelo Claude correto

A precisão do modelo é extremamente importante ao resumir documentos jurídicos. O Claude Sonnet 3.5 é uma excelente escolha para casos de uso como este, onde alta precisão é necessária. Se o tamanho e a quantidade de seus documentos forem grandes, a ponto de os custos começarem a se tornar uma preocupação, você também pode tentar usar um modelo menor como o Claude Haiku 3. Para ajudar a estimar esses custos, abaixo está uma comparação do custo para resumir 1.000 contratos de sublocação usando tanto o Sonnet quanto o Haiku:

Tamanho do conteúdo
- Número de contratos: 1.000
- Caracteres por contrato: 300.000
- Total de caracteres: 300M
Tokens estimados
- Tokens de entrada: 86M (assumindo 1 token por 3,5 caracteres)
- Tokens de saída por resumo: 350
- Total de tokens de saída: 350.000
Custo estimado do Claude Sonnet 4
- Custo de tokens de entrada: 86 MTok * $3,00/MTok = $258
- Custo de tokens de saída: 0,35 MTok * $15,00/MTok = $5,25
- Custo total: $258,00 + $5,25 = $263,25
Custo estimado do Claude Haiku 3
- Custo de tokens de entrada: 86 MTok * $0,25/MTok = $21,50
- Custo de tokens de saída: 0,35 MTok * $1,25/MTok = $0,44
- Custo total: $21,50 + $0,44 = $21,96

Os custos reais podem diferir dessas estimativas. Essas estimativas são baseadas no exemplo destacado na seção sobre prompting.

Transforme documentos em um formato que o Claude possa processar

Antes de começar a resumir documentos, você precisa preparar seus dados. Isso envolve extrair texto de PDFs, limpar o texto e garantir que ele esteja pronto para ser processado pelo Claude. Aqui está uma demonstração desse processo em um PDF de exemplo:

from io import BytesIO
import re

import pypdf
import requests

def get_llm_text(pdf_file):
    reader = pypdf.PdfReader(pdf_file)
    text = "\n".join([page.extract_text() for page in reader.pages])

    # Remove espaços em branco extras
    text = re.sub(r'\s+', ' ', text) 

    # Remove números de página
    text = re.sub(r'\n\s*\d+\s*\n', '\n', text) 

    return text


# Cria a URL completa do repositório GitHub
url = "https://raw.githubusercontent.com/anthropics/anthropic-cookbook/main/skills/summarization/data/Sample Sublease Agreement.pdf"
url = url.replace(" ", "%20")

# Baixa o arquivo PDF para a memória
response = requests.get(url)

# Carrega o PDF da memória
pdf_file = BytesIO(response.content)

document_text = get_llm_text(pdf_file) 
print(document_text[:50000])

Neste exemplo, primeiro baixamos um PDF de um contrato de sublocação de exemplo usado no cookbook de resumos. Este contrato foi obtido de um contrato de sublocação publicamente disponível no site sec.gov. Usamos a biblioteca pypdf para extrair o conteúdo do PDF e convertê-lo em texto. Os dados de texto são então limpos, removendo espaços em branco extras e números de página.

Construa um prompt forte

O Claude pode se adaptar a vários estilos de resumo. Você pode alterar os detalhes do prompt para orientar o Claude a ser mais ou menos verboso, incluir mais ou menos terminologia técnica, ou fornecer um resumo de nível mais alto ou mais baixo do contexto em questão. Aqui está um exemplo de como criar um prompt que garanta que os resumos gerados sigam uma estrutura consistente ao analisar contratos de sublocação:

import anthropic

# Inicializa o cliente Anthropic
client = anthropic.Anthropic()

def summarize_document(text, details_to_extract, model="claude-opus-4-20250514", max_tokens=1000):

    # Formata os detalhes a serem extraídos para serem colocados no contexto do prompt
    details_to_extract_str = '\n'.join(details_to_extract)
    
    # Solicita ao modelo que resuma o contrato de sublocação
    prompt = f"""Resuma o seguinte contrato de sublocação. Concentre-se nestes aspectos-chave:

    {details_to_extract_str}

    Forneça o resumo em tópicos aninhados dentro do cabeçalho XML para cada seção. Por exemplo:

    <partes envolvidas>
    - Sublocador: [Nome]
    // Adicione mais detalhes conforme necessário
    </partes envolvidas>
    
    Se alguma informação não estiver explicitamente declarada no documento, anote-a como "Não especificado". Não faça preâmbulo.

    Texto do contrato de sublocação:
    {text}
    """

    response = client.messages.create(
        model=model,
        max_tokens=max_tokens,
        system="Você é um analista jurídico especializado em direito imobiliário, conhecido por resumos altamente precisos e detalhados de contratos de sublocação.",
        messages=[
            {"role": "user", "content": prompt},
            {"role": "assistant", "content": "Aqui está o resumo do contrato de sublocação: <summary>"}
        ],
        stop_sequences=["</summary>"]
    )

    return response.content[0].text

sublease_summary = summarize_document(document_text, details_to_extract)
print(sublease_summary)

Este código implementa uma função summarize_document que usa o Claude para resumir o conteúdo de um contrato de sublocação. A função aceita uma string de texto e uma lista de detalhes a serem extraídos como entradas. Neste exemplo, chamamos a função com as variáveis document_text e details_to_extract que foram definidas nos trechos de código anteriores. Dentro da função, um prompt é gerado para o Claude, incluindo o documento a ser resumido, os detalhes a serem extraídos e instruções específicas para resumir o documento. O prompt instrui o Claude a responder com um resumo de cada detalhe a ser extraído, aninhado dentro de cabeçalhos XML. Como decidimos exibir cada seção do resumo dentro de tags, cada seção pode ser facilmente analisada como uma etapa de pós-processamento. Essa abordagem permite resumos estruturados que podem ser adaptados para seu caso de uso, de modo que cada resumo siga o mesmo padrão.

Avalie seu prompt

O prompting geralmente requer testes e otimização para estar pronto para produção. Para determinar a prontidão da sua solução, avalie a qualidade dos seus resumos usando um processo sistemático que combine métodos quantitativos e qualitativos. Criar uma avaliação empírica forte baseada em seus critérios de sucesso definidos permitirá otimizar seus prompts. Aqui estão algumas métricas que você pode desejar incluir em sua avaliação empírica:

Pontuações ROUGE

Pontuações BLEU

Similaridade de embedding contextual

Classificação baseada em LLM

Avaliação humana

Implante seu prompt

Aqui estão algumas considerações adicionais a serem lembradas ao implantar sua solução em produção.

Garanta ausência de responsabilidade: Entenda as implicações legais de erros nos resumos, que poderiam levar a responsabilidade legal para sua organização ou clientes. Forneça avisos legais ou notificações esclarecendo que os resumos são gerados por IA e devem ser revisados por profissionais jurídicos.
Lide com diversos tipos de documentos: Neste guia, discutimos como extrair texto de PDFs. No mundo real, os documentos podem vir em uma variedade de formatos (PDFs, documentos Word, arquivos de texto, etc.). Certifique-se de que seu pipeline de extração de dados possa converter todos os formatos de arquivo que você espera receber.
Paralelize chamadas de API para o Claude: Documentos longos com um grande número de tokens podem exigir até um minuto para que o Claude gere um resumo. Para grandes coleções de documentos, você pode querer enviar chamadas de API para o Claude em paralelo para que os resumos possam ser concluídos em um prazo razoável. Consulte os limites de taxa da Anthropic para determinar o número máximo de chamadas de API que podem ser realizadas em paralelo.

Melhore o desempenho

Em cenários complexos, pode ser útil considerar estratégias adicionais para melhorar o desempenho além das técnicas padrão de engenharia de prompt. Aqui estão algumas estratégias avançadas:

Realize meta-resumo para resumir documentos longos

O resumo jurídico frequentemente envolve o manuseio de documentos longos ou muitos documentos relacionados de uma vez, de modo que você ultrapassa a janela de contexto do Claude. Você pode usar um método de fragmentação conhecido como meta-resumo para lidar com este caso de uso. Esta técnica envolve dividir documentos em partes menores e gerenciáveis e, em seguida, processar cada parte separadamente. Você pode então combinar os resumos de cada parte para criar um meta-resumo de todo o documento. Aqui está um exemplo de como realizar meta-resumo:

import anthropic

# Inicializa o cliente Anthropic
client = anthropic.Anthropic()

def chunk_text(text, chunk_size=20000):
    return [text[i:i+chunk_size] for i in range(0, len(text), chunk_size)]

def summarize_long_document(text, details_to_extract, model="claude-opus-4-20250514", max_tokens=1000):

    # Formata os detalhes a serem extraídos para serem colocados no contexto do prompt
    details_to_extract_str = '\n'.join(details_to_extract)

    # Itera sobre os fragmentos e resume cada um
    chunk_summaries = [summarize_document(chunk, details_to_extract, model=model, max_tokens=max_tokens) for chunk in chunk_text(text)]
    
    final_summary_prompt = f"""
    
    Você está olhando para os resumos fragmentados de vários documentos que estão todos relacionados. 
    Combine os seguintes resumos do documento de diferentes fontes confiáveis em um resumo geral coerente:

    <chunked_summaries>
    {"".join(chunk_summaries)}
    </chunked_summaries>

    Concentre-se nestes aspectos-chave:
    {details_to_extract_str})

    Forneça o resumo em tópicos aninhados dentro do cabeçalho XML para cada seção. Por exemplo:

    <partes envolvidas>
    - Sublocador: [Nome]
    // Adicione mais detalhes conforme necessário
    </partes envolvidas>
    
    Se alguma informação não estiver explicitamente declarada no documento, anote-a como "Não especificado". Não faça preâmbulo.
    """

    response = client.messages.create(
        model=model,
        max_tokens=max_tokens,
        system="Você é um especialista jurídico que resume notas sobre um documento.",
        messages=[
            {"role": "user",  "content": final_summary_prompt},
            {"role": "assistant", "content": "Aqui está o resumo do contrato de sublocação: <summary>"}

        ],
        stop_sequences=["</summary>"]
    )
    
    return response.content[0].text

long_summary = summarize_long_document(document_text, details_to_extract)
print(long_summary)

A função summarize_long_document se baseia na função anterior summarize_document, dividindo o documento em partes menores e resumindo cada parte individualmente. O código alcança isso aplicando a função summarize_document a cada fragmento de 20.000 caracteres dentro do documento original. Os resumos individuais são então combinados, e um resumo final é criado a partir desses resumos de fragmentos. Observe que a função summarize_long_document não é estritamente necessária para nosso exemplo de PDF, pois o documento inteiro cabe na janela de contexto do Claude. No entanto, ela se torna essencial para documentos que excedem a janela de contexto do Claude ou ao resumir vários documentos relacionados juntos. Independentemente disso, essa técnica de meta-resumo geralmente captura detalhes importantes adicionais no resumo final que foram perdidos na abordagem anterior de resumo único.

Use documentos indexados por resumo para explorar uma grande coleção de documentos

Pesquisar uma coleção de documentos com um LLM geralmente envolve geração aumentada por recuperação (RAG). No entanto, em cenários envolvendo documentos grandes ou quando a recuperação precisa de informações é crucial, uma abordagem RAG básica pode ser insuficiente. Documentos indexados por resumo é uma abordagem RAG avançada que fornece uma maneira mais eficiente de classificar documentos para recuperação, usando menos contexto do que os métodos RAG tradicionais. Nessa abordagem, você primeiro usa o Claude para gerar um resumo conciso para cada documento em seu corpus e, em seguida, usa o Clade para classificar a relevância de cada resumo para a consulta sendo feita. Para mais detalhes sobre essa abordagem, incluindo um exemplo baseado em código, confira a seção de documentos indexados por resumo no cookbook de resumos.

Fine-tune o Claude para aprender com seu conjunto de dados

Outra técnica avançada para melhorar a capacidade do Claude de gerar resumos é o fine-tuning. O fine-tuning envolve treinar o Claude em um conjunto de dados personalizado que se alinha especificamente com suas necessidades de resumo jurídico, garantindo que o Claude se adapte ao seu caso de uso. Aqui está uma visão geral de como realizar o fine-tuning:

Identifique erros: Comece coletando instâncias onde os resumos do Claude ficam aquém - isso pode incluir a falta de detalhes jurídicos críticos, mal-entendidos de contexto ou o uso de terminologia jurídica inadequada.
Organize um conjunto de dados: Uma vez que você tenha identificado esses problemas, compile um conjunto de dados desses exemplos problemáticos. Este conjunto de dados deve incluir os documentos jurídicos originais juntamente com seus resumos corrigidos, garantindo que o Claude aprenda o comportamento desejado.
Realize o fine-tuning: O fine-tuning envolve retreinar o modelo em seu conjunto de dados organizado para ajustar seus pesos e parâmetros. Este retreinamento ajuda o Claude a entender melhor os requisitos específicos do seu domínio jurídico, melhorando sua capacidade de resumir documentos de acordo com seus padrões.
Melhoria iterativa: O fine-tuning não é um processo único. À medida que o Claude continua a gerar resumos, você pode iterativamente adicionar novos exemplos onde ele teve desempenho insatisfatório, refinando ainda mais suas capacidades. Com o tempo, este ciclo contínuo de feedback resultará em um modelo altamente especializado para suas tarefas de resumo jurídico.

O fine-tuning está atualmente disponível apenas via Amazon Bedrock. Detalhes adicionais estão disponíveis no blog de lançamento da AWS.

Cookbook de resumos

Veja um exemplo completamente implementado baseado em código de como usar o Claude para resumir contratos.

Cookbook de citações

Explore nossa receita do Cookbook de Citações para orientação sobre como garantir precisão e explicabilidade das informações.

Primeiros passos

Modelos e preços

Saiba mais sobre Claude

Capacidades

Ferramentas

Protocolo de Contexto do Modelo (MCP)

Casos de uso

Engenharia de prompts

Testar e avaliar

Fortalecer proteções

Centro legal

Antes de construir com o Claude

Decida se deve usar o Claude para resumos jurídicos

Determine os detalhes que você deseja que o resumo extraia

Estabeleça critérios de sucesso

Como resumir documentos jurídicos usando o Claude

Selecione o modelo Claude correto

Transforme documentos em um formato que o Claude possa processar

Construa um prompt forte

Avalie seu prompt

Implante seu prompt

Melhore o desempenho

Realize meta-resumo para resumir documentos longos

Use documentos indexados por resumo para explorar uma grande coleção de documentos

Fine-tune o Claude para aprender com seu conjunto de dados

Cookbook de resumos

Cookbook de citações

Primeiros passos

Modelos e preços

Saiba mais sobre Claude

Capacidades

Ferramentas

Protocolo de Contexto do Modelo (MCP)

Casos de uso

Engenharia de prompts

Testar e avaliar

Fortalecer proteções

Centro legal

​Antes de construir com o Claude

​Decida se deve usar o Claude para resumos jurídicos

​Determine os detalhes que você deseja que o resumo extraia

​Estabeleça critérios de sucesso

​Como resumir documentos jurídicos usando o Claude

​Selecione o modelo Claude correto

​Transforme documentos em um formato que o Claude possa processar

​Construa um prompt forte

​Avalie seu prompt

​Implante seu prompt

​Melhore o desempenho

​Realize meta-resumo para resumir documentos longos

​Use documentos indexados por resumo para explorar uma grande coleção de documentos

​Fine-tune o Claude para aprender com seu conjunto de dados

Cookbook de resumos

Cookbook de citações

Antes de construir com o Claude

Decida se deve usar o Claude para resumos jurídicos

Determine os detalhes que você deseja que o resumo extraia

Estabeleça critérios de sucesso

Como resumir documentos jurídicos usando o Claude

Selecione o modelo Claude correto

Transforme documentos em um formato que o Claude possa processar

Construa um prompt forte

Avalie seu prompt

Implante seu prompt

Melhore o desempenho

Realize meta-resumo para resumir documentos longos

Use documentos indexados por resumo para explorar uma grande coleção de documentos

Fine-tune o Claude para aprender com seu conjunto de dados