Цитирование

Claude способен предоставлять подробные цитаты при ответах на вопросы о документах, помогая вам отслеживать и проверять источники информации в ответах. Функция цитирования в настоящее время доступна в Claude Opus 4, Claude Sonnet 4, Claude Sonnet 3.7, Claude Sonnet 3.5 (новая версия) и Haiku 3.5.

Цитирование с Claude Sonnet 3.7Claude Sonnet 3.7 может быть менее склонен к созданию цитат по сравнению с другими моделями Claude без более явных инструкций от пользователя. При использовании цитирования с Claude Sonnet 3.7 мы рекомендуем включать дополнительные инструкции в ход user, например "Используйте цитаты для подтверждения вашего ответа.".Мы также заметили, что когда модель просят структурировать свой ответ, она вряд ли будет использовать цитаты, если явно не сказать использовать цитаты в этом формате. Например, если модель просят использовать теги <result> в своем ответе, вы должны добавить что-то вроде

"Всегда используйте цитаты в своем ответе, даже внутри тегов <result>."

Пожалуйста, поделитесь своими отзывами и предложениями о функции цитирования, используя эту форму.

Вот пример того, как использовать цитирование с Messages API:

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "claude-opus-4-20250514",
    "max_tokens": 1024,
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "document",
            "source": {
              "type": "text",
              "media_type": "text/plain",
              "data": "The grass is green. The sky is blue."
            },
            "title": "My Document",
            "context": "This is a trustworthy document.",
            "citations": {"enabled": true}
          },
          {
            "type": "text",
            "text": "What color is the grass and sky?"
          }
        ]
      }
    ]
  }'

Сравнение с подходами на основе промптовПо сравнению с решениями цитирования на основе промптов, функция цитирования имеет следующие преимущества:

Экономия затрат: Если ваш подход на основе промптов просит Claude выводить прямые цитаты, вы можете увидеть экономию затрат из-за того, что cited_text не засчитывается в ваши выходные токены.
Лучшая надежность цитирования: Поскольку мы разбираем цитаты в соответствующие форматы ответов, упомянутые выше, и извлекаем cited_text, цитаты гарантированно содержат действительные указатели на предоставленные документы.
Улучшенное качество цитирования: В наших оценках мы обнаружили, что функция цитирования значительно чаще цитирует наиболее релевантные цитаты из документов по сравнению с чисто промптовыми подходами.

Как работает цитирование

Интегрируйте цитирование с Claude в следующих шагах:

Предоставьте документ(ы) и включите цитирование

Включите документы в любом из поддерживаемых форматов: PDF, обычный текст или документы пользовательского содержимого
Установите citations.enabled=true для каждого из ваших документов. В настоящее время цитирование должно быть включено для всех или ни одного из документов в запросе.
Обратите внимание, что в настоящее время поддерживаются только текстовые цитаты, а цитирование изображений пока невозможно.

Документы обрабатываются

Содержимое документов “разбивается на части” для определения минимальной детализации возможных цитат. Например, разбивка на предложения позволила бы Claude цитировать одно предложение или связывать несколько последовательных предложений для цитирования абзаца (или более длинного текста)!
- Для PDF: Текст извлекается, как описано в Поддержка PDF, и содержимое разбивается на предложения. Цитирование изображений из PDF в настоящее время не поддерживается.
- Для документов с обычным текстом: Содержимое разбивается на предложения, которые можно цитировать.
- Для документов с пользовательским содержимым: Ваши предоставленные блоки содержимого используются как есть, и дальнейшее разбиение не производится.

Claude предоставляет ответ с цитатами

Ответы теперь могут включать несколько текстовых блоков, где каждый текстовый блок может содержать утверждение, которое делает Claude, и список цитат, поддерживающих это утверждение.
Цитаты ссылаются на конкретные места в исходных документах. Формат этих цитат зависит от типа документа, из которого цитируется.
- Для PDF: цитаты будут включать диапазон номеров страниц (с индексацией от 1).
- Для документов с обычным текстом: Цитаты будут включать диапазон индексов символов (с индексацией от 0).
- Для документов с пользовательским содержимым: Цитаты будут включать диапазон индексов блоков содержимого (с индексацией от 0), соответствующий исходному списку содержимого.
Индексы документов предоставляются для указания исходного источника и имеют индексацию от 0 согласно списку всех документов в вашем исходном запросе.

Автоматическое разбиение против пользовательского содержимогоПо умолчанию документы с обычным текстом и PDF автоматически разбиваются на предложения. Если вам нужен больший контроль над детализацией цитирования (например, для маркированных списков или транскриптов), используйте вместо этого документы с пользовательским содержимым. См. Типы документов для получения дополнительной информации.Например, если вы хотите, чтобы Claude мог цитировать конкретные предложения из ваших RAG-фрагментов, вы должны поместить каждый RAG-фрагмент в документ с обычным текстом. В противном случае, если вы не хотите, чтобы производилось дальнейшее разбиение, или если вы хотите настроить любое дополнительное разбиение, вы можете поместить RAG-фрагменты в документ(ы) с пользовательским содержимым.

Цитируемое против нецитируемого содержимого

Текст, найденный в содержимом source документа, может быть процитирован.
title и context являются необязательными полями, которые будут переданы модели, но не будут использоваться для цитируемого содержимого.
title ограничен по длине, поэтому вы можете найти поле context полезным для хранения любых метаданных документа в виде текста или строкового json.

Индексы цитирования

Индексы документов имеют индексацию от 0 из списка всех блоков содержимого документа в запросе (охватывающих все сообщения).
Индексы символов имеют индексацию от 0 с исключающими конечными индексами.
Номера страниц имеют индексацию от 1 с исключающими конечными номерами страниц.
Индексы блоков содержимого имеют индексацию от 0 с исключающими конечными индексами из списка content, предоставленного в документе с пользовательским содержимым.

Стоимость токенов

Включение цитирования приводит к небольшому увеличению входных токенов из-за добавлений системного промпта и разбиения документов.
Однако функция цитирования очень эффективна с выходными токенами. Под капотом модель выводит цитаты в стандартизированном формате, которые затем разбираются в цитируемый текст и индексы местоположения документа. Поле cited_text предоставляется для удобства и не засчитывается в выходные токены.
При передаче обратно в последующих ходах разговора cited_text также не засчитывается во входные токены.

Совместимость функций

Цитирование работает в сочетании с другими функциями API, включая кэширование промптов, подсчет токенов и пакетную обработку.

Использование кэширования промптов с цитированием

Цитирование и кэширование промптов могут эффективно использоваться вместе. Блоки цитирования, генерируемые в ответах, не могут быть кэшированы напрямую, но исходные документы, на которые они ссылаются, могут быть кэшированы. Для оптимизации производительности примените cache_control к вашим блокам содержимого документов верхнего уровня.

import anthropic

client = anthropic.Anthropic()

# Длинное содержимое документа (например, техническая документация)
long_document = "This is a very long document with thousands of words..." + " ... " * 1000  # Минимальная длина для кэширования

response = client.messages.create(
    model="claude-opus-4-20250514",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "text",
                        "media_type": "text/plain",
                        "data": long_document
                    },
                    "citations": {"enabled": True},
                    "cache_control": {"type": "ephemeral"}  # Кэшировать содержимое документа
                },
                {
                    "type": "text",
                    "text": "What does this document say about API features?"
                }
            ]
        }
    ]
)

В этом примере:

Содержимое документа кэшируется с использованием cache_control на блоке документа
Цитирование включено для документа
Claude может генерировать ответы с цитатами, получая преимущества от кэшированного содержимого документа
Последующие запросы, использующие тот же документ, получат преимущества от кэшированного содержимого

Типы документов

Выбор типа документа

Мы поддерживаем три типа документов для цитирования. Документы могут быть предоставлены непосредственно в сообщении (base64, текст или URL) или загружены через Files API и ссылаться по file_id:

Тип	Лучше всего для	Разбиение	Формат цитирования
Обычный текст	Простые текстовые документы, проза	Предложение	Индексы символов (с индексацией от 0)
PDF	PDF-файлы с текстовым содержимым	Предложение	Номера страниц (с индексацией от 1)
Пользовательское содержимое	Списки, транскрипты, специальное форматирование, более детализированные цитаты	Без дополнительного разбиения	Индексы блоков (с индексацией от 0)

Файлы .csv, .xlsx, .docx, .md и .txt не поддерживаются как блоки документов. Преобразуйте их в обычный текст и включите непосредственно в содержимое сообщения. См. Работа с другими форматами файлов.

Документы с обычным текстом

Документы с обычным текстом автоматически разбиваются на предложения. Вы можете предоставить их встроенными или по ссылке с их file_id:

{
    "type": "document",
    "source": {
        "type": "text",
        "media_type": "text/plain",
        "data": "Plain text content..."
    },
    "title": "Document Title", # необязательно
    "context": "Context about the document that will not be cited from", # необязательно
    "citations": {"enabled": True}
}

Пример цитирования обычного текста

{
    "type": "char_location",
    "cited_text": "The exact text being cited", # не засчитывается в выходные токены
    "document_index": 0,
    "document_title": "Document Title",
    "start_char_index": 0,    # с индексацией от 0
    "end_char_index": 50      # исключающий
}

PDF-документы

PDF-документы могут быть предоставлены как данные в кодировке base64 или по file_id. Текст PDF извлекается и разбивается на предложения. Поскольку цитирование изображений пока не поддерживается, PDF-файлы, которые являются сканами документов и не содержат извлекаемого текста, не будут цитируемыми.

{
    "type": "document",
    "source": {
        "type": "base64",
        "media_type": "application/pdf",
        "data": base64_encoded_pdf_data
    },
    "title": "Document Title", # необязательно
    "context": "Context about the document that will not be cited from", # необязательно
    "citations": {"enabled": True}
}

Пример цитирования PDF

{
    "type": "page_location",
    "cited_text": "The exact text being cited", # не засчитывается в выходные токены
    "document_index": 0,     
    "document_title": "Document Title", 
    "start_page_number": 1,  # с индексацией от 1
    "end_page_number": 2     # исключающий
}

Документы с пользовательским содержимым

Документы с пользовательским содержимым дают вам контроль над детализацией цитирования. Дополнительное разбиение не производится, и фрагменты предоставляются модели согласно предоставленным блок содержимого.

{
    "type": "document",
    "source": {
        "type": "content",
        "content": [
            {"type": "text", "text": "First chunk"},
            {"type": "text", "text": "Second chunk"}
        ]
    },
    "title": "Document Title", # необязательно
    "context": "Context about the document that will not be cited from", # необязательно
    "citations": {"enabled": True}
}

Пример цитирования

{
    "type": "content_block_location",
    "cited_text": "The exact text being cited", # не засчитывается в выходные токены
    "document_index": 0,
    "document_title": "Document Title",
    "start_block_index": 0,   # с индексацией от 0
    "end_block_index": 1      # исключающий
}

Структура ответа

Когда цитирование включено, ответы включают несколько текстовых блоков с цитатами:

{
    "content": [
        {
            "type": "text",
            "text": "According to the document, "
        },
        {
            "type": "text",
            "text": "the grass is green",
            "citations": [{
                "type": "char_location",
                "cited_text": "The grass is green.",
                "document_index": 0,
                "document_title": "Example Document",
                "start_char_index": 0,
                "end_char_index": 20
            }]
        },
        {
            "type": "text",
            "text": " and "
        },
        {
            "type": "text",
            "text": "the sky is blue",
            "citations": [{
                "type": "char_location",
                "cited_text": "The sky is blue.",
                "document_index": 0,
                "document_title": "Example Document",
                "start_char_index": 20,
                "end_char_index": 36
            }]
        },
        {
            "type": "text",
            "text": ". Information from page 5 states that ",
        },
        {
            "type": "text",
            "text": "water is essential",
            "citations": [{
                "type": "page_location",
                "cited_text": "Water is essential for life.",
                "document_index": 1,
                "document_title": "PDF Document",
                "start_page_number": 5,
                "end_page_number": 6
            }]
        },
        {
            "type": "text",
            "text": ". The custom document mentions ",
        },
        {
            "type": "text",
            "text": "important findings",
            "citations": [{
                "type": "content_block_location",
                "cited_text": "These are important findings.",
                "document_index": 2,
                "document_title": "Custom Content Document",
                "start_block_index": 0,
                "end_block_index": 1
            }]
        }
    ]
}

Поддержка потоковой передачи

Для потоковых ответов мы добавили тип citations_delta, который содержит одну цитату для добавления в список citations текущего блока содержимого text.

Пример потоковых событий

event: message_start
data: {"type": "message_start", ...}

event: content_block_start
data: {"type": "content_block_start", "index": 0, ...}

event: content_block_delta
data: {"type": "content_block_delta", "index": 0, 
       "delta": {"type": "text_delta", "text": "According to..."}}

event: content_block_delta
data: {"type": "content_block_delta", "index": 0,
       "delta": {"type": "citations_delta", 
                 "citation": {
                     "type": "char_location",
                     "cited_text": "...",
                     "document_index": 0,
                     ...
                 }}}

event: content_block_stop
data: {"type": "content_block_stop", "index": 0}

event: message_stop
data: {"type": "message_stop"}

Первые шаги

Модели и цены

Узнать о Claude

Возможности

Инструменты

Протокол контекста модели (MCP)

Варианты использования

Инженерия промптов

Тестирование и оценка

Усилить защитные меры

Юридический центр

Цитирование

Как работает цитирование

Цитируемое против нецитируемого содержимого

Индексы цитирования

Стоимость токенов

Совместимость функций

Использование кэширования промптов с цитированием

Типы документов

Выбор типа документа

Документы с обычным текстом

PDF-документы

Документы с пользовательским содержимым

Структура ответа

Поддержка потоковой передачи

Первые шаги

Модели и цены

Узнать о Claude

Возможности

Инструменты

Протокол контекста модели (MCP)

Варианты использования

Инженерия промптов

Тестирование и оценка

Усилить защитные меры

Юридический центр

​Как работает цитирование

​Цитируемое против нецитируемого содержимого

​Индексы цитирования

​Стоимость токенов

​Совместимость функций

​Использование кэширования промптов с цитированием

​Типы документов

​Выбор типа документа

​Документы с обычным текстом

​PDF-документы

​Документы с пользовательским содержимым

​Структура ответа

​Поддержка потоковой передачи

Как работает цитирование

Цитируемое против нецитируемого содержимого

Индексы цитирования

Стоимость токенов

Совместимость функций

Использование кэширования промптов с цитированием

Типы документов

Выбор типа документа

Документы с обычным текстом

PDF-документы

Документы с пользовательским содержимым

Структура ответа

Поддержка потоковой передачи