Citações
O Claude é capaz de fornecer citações detalhadas ao responder perguntas sobre documentos, ajudando você a rastrear e verificar fontes de informação nas respostas.
O recurso de citações está atualmente disponível no Claude Opus 4, Claude Sonnet 4, Claude Sonnet 3.7, Claude Sonnet 3.5 (novo) e Haiku 3.5.
Citações com o Claude Sonnet 3.7
O Claude Sonnet 3.7 pode ter menor probabilidade de fazer citações em comparação com outros modelos Claude sem instruções mais explícitas do usuário. Ao usar citações com o Claude Sonnet 3.7, recomendamos incluir instruções adicionais no turno do user
, como "Use citações para fundamentar sua resposta."
por exemplo.
Também observamos que quando o modelo é solicitado a estruturar sua resposta, é improvável que use citações, a menos que seja explicitamente instruído a usar citações dentro desse formato. Por exemplo, se for solicitado ao modelo usar tags
Por favor, compartilhe seu feedback e sugestões sobre o recurso de citações usando este formulário.
Aqui está um exemplo de como usar citações com a API Messages:
Comparação com abordagens baseadas em prompts
Em comparação com soluções de citações baseadas em prompts, o recurso de citações tem as seguintes vantagens:
- Economia de custos: Se sua abordagem baseada em prompts pede ao Claude para gerar citações diretas, você pode ver economia de custos devido ao fato de que
cited_text
não conta para seus tokens de saída. - Melhor confiabilidade de citação: Como analisamos as citações nos respectivos formatos de resposta mencionados acima e extraímos
cited_text
, as citações são garantidas para conter ponteiros válidos para os documentos fornecidos. - Qualidade de citação aprimorada: Em nossas avaliações, descobrimos que o recurso de citações tem probabilidade significativamente maior de citar as citações mais relevantes dos documentos em comparação com abordagens puramente baseadas em prompts.
Como funcionam as citações
Integre citações com o Claude nessas etapas:
Forneça documento(s) e habilite citações
- Inclua documentos em qualquer um dos formatos suportados: PDFs, texto simples ou documentos de conteúdo personalizado
- Defina
citations.enabled=true
em cada um dos seus documentos. Atualmente, as citações devem ser habilitadas em todos ou nenhum dos documentos dentro de uma solicitação. - Observe que atualmente apenas citações de texto são suportadas e citações de imagens ainda não são possíveis.
Os documentos são processados
- O conteúdo do documento é “dividido em partes” para definir a granularidade mínima de possíveis citações. Por exemplo, a divisão em frases permitiria que o Claude citasse uma única frase ou encadeasse várias frases consecutivas para citar um parágrafo (ou mais)!
- Para PDFs: O texto é extraído conforme descrito em Suporte a PDF e o conteúdo é dividido em frases. Citar imagens de PDFs não é suportado atualmente.
- Para documentos de texto simples: O conteúdo é dividido em frases que podem ser citadas.
- Para documentos de conteúdo personalizado: Seus blocos de conteúdo fornecidos são usados como estão e nenhuma divisão adicional é feita.
Claude fornece resposta com citações
- As respostas agora podem incluir vários blocos de texto, onde cada bloco de texto pode conter uma afirmação que o Claude está fazendo e uma lista de citações que apoiam a afirmação.
- As citações referenciam locais específicos nos documentos de origem. O formato dessas citações depende do tipo de documento que está sendo citado.
- Para PDFs: as citações incluirão o intervalo de números de página (começando em 1).
- Para documentos de texto simples: As citações incluirão o intervalo de índices de caracteres (começando em 0).
- Para documentos de conteúdo personalizado: As citações incluirão o intervalo de índices de blocos de conteúdo (começando em 0) correspondente à lista de conteúdo original fornecida.
- Os índices de documentos são fornecidos para indicar a fonte de referência e são indexados a partir de 0 de acordo com a lista de todos os documentos em sua solicitação original.
Divisão automática vs conteúdo personalizado
Por padrão, documentos de texto simples e PDF são automaticamente divididos em frases. Se você precisar de mais controle sobre a granularidade da citação (por exemplo, para marcadores ou transcrições), use documentos de conteúdo personalizado. Veja Tipos de Documento para mais detalhes.
Por exemplo, se você quiser que o Claude seja capaz de citar frases específicas de seus fragmentos RAG, você deve colocar cada fragmento RAG em um documento de texto simples. Caso contrário, se você não quiser que nenhuma divisão adicional seja feita, ou se quiser personalizar qualquer divisão adicional, você pode colocar fragmentos RAG em documento(s) de conteúdo personalizado.
Conteúdo citável vs não citável
- O texto encontrado dentro do conteúdo
source
de um documento pode ser citado. title
econtext
são campos opcionais que serão passados para o modelo, mas não serão usados como conteúdo citável.title
é limitado em comprimento, então você pode achar o campocontext
útil para armazenar quaisquer metadados do documento como texto ou json convertido em string.
Índices de citação
- Os índices de documentos são indexados a partir de 0 da lista de todos os blocos de conteúdo de documentos na solicitação (abrangendo todas as mensagens).
- Os índices de caracteres são indexados a partir de 0 com índices finais exclusivos.
- Os números de página são indexados a partir de 1 com números de página finais exclusivos.
- Os índices de blocos de conteúdo são indexados a partir de 0 com índices finais exclusivos da lista
content
fornecida no documento de conteúdo personalizado.
Custos de tokens
- Habilitar citações causa um leve aumento nos tokens de entrada devido a adições de prompts do sistema e divisão de documentos.
- No entanto, o recurso de citações é muito eficiente com tokens de saída. Internamente, o modelo está gerando citações em um formato padronizado que são então analisadas em texto citado e índices de localização de documentos. O campo
cited_text
é fornecido por conveniência e não conta para tokens de saída. - Quando passado de volta em turnos de conversa subsequentes,
cited_text
também não é contado para tokens de entrada.
Compatibilidade de recursos
Citações funcionam em conjunto com outros recursos da API, incluindo cache de prompts, contagem de tokens e processamento em lote.
Usando Cache de Prompts com Citações
Citações e cache de prompts podem ser usados juntos de forma eficaz.
Os blocos de citação gerados nas respostas não podem ser armazenados em cache diretamente, mas os documentos de origem que eles referenciam podem ser armazenados em cache. Para otimizar o desempenho, aplique cache_control
aos seus blocos de conteúdo de documento de nível superior.
Neste exemplo:
- O conteúdo do documento é armazenado em cache usando
cache_control
no bloco do documento - As citações estão habilitadas no documento
- O Claude pode gerar respostas com citações enquanto se beneficia do conteúdo do documento em cache
- Solicitações subsequentes usando o mesmo documento se beneficiarão do conteúdo em cache
Tipos de Documento
Escolhendo um tipo de documento
Suportamos três tipos de documentos para citações. Os documentos podem ser fornecidos diretamente na mensagem (base64, texto ou URL) ou carregados via API de Arquivos e referenciados por file_id
:
Tipo | Melhor para | Divisão | Formato de citação |
---|---|---|---|
Texto simples | Documentos de texto simples, prosa | Frase | Índices de caracteres (começando em 0) |
Arquivos PDF com conteúdo de texto | Frase | Números de página (começando em 1) | |
Conteúdo personalizado | Listas, transcrições, formatação especial, citações mais granulares | Sem divisão adicional | Índices de bloco (começando em 0) |
Documentos de texto simples
Documentos de texto simples são automaticamente divididos em frases. Você pode fornecê-los inline ou por referência com seu file_id
:
Documentos PDF
Documentos PDF podem ser fornecidos como dados codificados em base64 ou por file_id
. O texto do PDF é extraído e dividido em frases. Como citações de imagens ainda não são suportadas, PDFs que são digitalizações de documentos e não contêm texto extraível não serão citáveis.
Documentos de conteúdo personalizado
Documentos de conteúdo personalizado dão a você controle sobre a granularidade da citação. Nenhuma divisão adicional é feita e os fragmentos são fornecidos ao modelo de acordo com os blocos de conteúdo fornecidos.
Estrutura de Resposta
Quando as citações estão habilitadas, as respostas incluem vários blocos de texto com citações:
Suporte a Streaming
Para respostas em streaming, adicionamos um tipo citations_delta
que contém uma única citação a ser adicionada à lista citations
no bloco de conteúdo text
atual.