При создании сообщения вы можете установить "stream": true, чтобы постепенно передавать ответ с помощью server-sent events (SSE).

Потоковая передача с помощью SDK

Наши SDK для Python и Typescript предлагают несколько способов потоковой передачи. SDK для Python позволяет использовать как синхронные, так и асинхронные потоки. Подробности смотрите в документации каждого SDK.

import anthropic

client = anthropic.Anthropic()

with client.messages.stream(
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello"}],
    model="claude-3-opus-20240229",
) as stream:
  for text in stream.text_stream:
      print(text, end="", flush=True)

Типы событий

Каждое событие, отправляемое сервером, включает именованный тип события и связанные с ним данные JSON. Каждое событие будет использовать имя события SSE (например, event: message_stop) и включать соответствующий type в своих данных.

Каждый поток использует следующий поток событий:

  1. message_start: содержит объект Message с пустым content.
  2. Серия блоков контента, каждый из которых имеет события content_block_start, одно или несколько событий content_block_delta и событие content_block_stop. Каждый блок контента будет иметь index, который соответствует его индексу в конечном массиве content объекта Message.
  3. Одно или несколько событий message_delta, указывающих на изменения верхнего уровня в конечном объекте Message.
  4. Финальное событие message_stop.

События ping

Потоки событий также могут включать любое количество событий ping.

События ошибок

Мы можем время от времени отправлять ошибки в потоке событий. Например, в периоды высокой нагрузки вы можете получить overloaded_error, что обычно соответствует HTTP 529 в контексте без потоковой передачи:

Пример ошибки
event: error
data: {"type": "error", "error": {"type": "overloaded_error", "message": "Перегрузка"}}

Другие события

В соответствии с нашей политикой версионирования, мы можем добавлять новые типы событий, и ваш код должен корректно обрабатывать неизвестные типы событий.

Типы дельт

Каждое событие content_block_delta содержит delta типа, который обновляет блок content по заданному index.

Текстовая дельта

Текстовая дельта блока контента выглядит так:

Текстовая дельта
event: content_block_delta
data: {"type": "content_block_delta","index": 0,"delta": {"type": "text_delta", "text": "ривет дру"}}

Дельта входного JSON

Дельты входного JSON являются частью бета-версии использования инструментов.

Дельты для блоков контента tool_use соответствуют обновлениям поля input блока. Для обеспечения максимальной детализации дельты являются частичными строками JSON, тогда как конечный tool_use.input всегда является объектом.

Вы можете накапливать строковые дельты и анализировать JSON после получения события content_block_stop, используя библиотеку вроде Pydantic для частичного анализа JSON или используя наши SDK, которые предоставляют помощники для доступа к проанализированным инкрементным значениям.

Дельта блока контента tool_use выглядит так:

Дельта входного JSON
event: content_block_delta
data: {"type": "content_block_delta","index": 1,"delta": {"type": "input_json_delta","partial_json": "{\"location\": \"Сан-Фра"}}}

Примечание: Наши текущие модели поддерживают вывод только одного полного ключа и значения свойства из input за раз. Таким образом, при использовании инструментов между событиями потоковой передачи могут возникать задержки, пока модель работает. После накопления ключа и значения input мы выдаем их как несколько событий content_block_delta с фрагментированным частичным JSON, чтобы формат мог автоматически поддерживать более тонкую детализацию в будущих моделях.

Необработанный ответ HTTP Stream

Мы настоятельно рекомендуем использовать наши клиентские SDK при использовании режима потоковой передачи. Однако, если вы создаете прямую интеграцию с API, вам нужно будет обрабатывать эти события самостоятельно.

Ответ потока состоит из:

  1. События message_start
  2. Потенциально нескольких блоков контента, каждый из которых содержит: a. Событие content_block_start b. Потенциально несколько событий content_block_delta c. Событие content_block_stop
  3. События message_delta
  4. События message_stop

Также по всему ответу могут быть разбросаны события ping. Подробнее о формате см. в разделе Типы событий.

Базовый запрос потоковой передачи

Запрос
curl https://api.anthropic.com/v1/messages \
     --header "anthropic-version: 2023-06-01" \
     --header "anthropic-beta: messages-2023-12-15" \
     --header "content-type: application/json" \
     --header "x-api-key: $ANTHROPIC_API_KEY" \
     --data \
'{
  "model": "claude-3-opus-20240229",
  "messages": [{"role": "user", "content": "Hello"}],
  "max_tokens": 256,
  "stream": true
}'
Ответ
event: message_start
data: {"type": "message_start", "message": {"id": "msg_1nZdL29xx5MUA1yADyHTEsnR8uuvGzszyY", "type": "message", "role": "assistant", "content": [], "model": "claude-3-opus-20240229", "stop_reason": null, "stop_sequence": null, "usage": {"input_tokens": 25, "output_tokens": 1}}}

event: content_block_start
data: {"type": "content_block_start", "index": 0, "content_block": {"type": "text", "text": ""}}

event: ping
data: {"type": "ping"}

event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "text_delta", "text": "Привет"}}

event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "text_delta", "text": "!"}}

event: content_block_stop
data: {"type": "content_block_stop", "index": 0}

event: message_delta
data: {"type": "message_delta", "delta": {"stop_reason": "end_turn", "stop_sequence":null}, "usage": {"output_tokens": 15}}

event: message_stop
data: {"type": "message_stop"}

Запрос потоковой передачи с использованием инструмента

В этом запросе мы просим Claude использовать инструмент, чтобы сообщить нам погоду.

Запрос
  curl https://api.anthropic.com/v1/messages \
    -H "content-type: application/json" \
    -H "x-api-key: $ANTHROPIC_API_KEY" \
    -H "anthropic-version: 2023-06-01" \
    -H "anthropic-beta: tools-2024-05-16" \
    -d '{
      "model": "claude-3-opus-20240229",
      "max_tokens": 1024,
      "tools": [
        {
          "name": "get_weather",
          "description": "Получить текущую погоду в заданном месте",
          "input_schema": {
            "type": "object",
            "properties": {
              "location": {
                "type": "string",
                "description": "Город и штат, например, Сан-Франциско, Калифорния"
              }
            },
            "required": ["location"]
          }
        }
      ],
      "tool_choice": {"type": "any"},
      "messages": [
        {
          "role": "user",
          "content": "Какая погода в Сан-Франциско?"
        }
      ],
      "stream": true
    }'
Ответ
event: message_start
data: {"type":"message_start","message":{"id":"msg_014p7gG3wDgGV9EUtLvnow3U","type":"message","role":"assistant","model":"claude-3-haiku-20240307","stop_sequence":null,"usage":{"input_tokens":472,"output_tokens":2},"content":[],"stop_reason":null}}

event: content_block_start
data: {"type":"content_block_start","index":0,"content_block":{"type":"text","text":""}}

event: ping
data: {"type": "ping"}

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":"Хорошо"}}

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":","}}

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":" давайте"}}

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":" проверим"}}

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":" погоду"}}

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":" для"}}

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":" Сан"}}

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":"-Франциско"}}

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":","}}

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":" Калифорния"}}

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":":"}}

event: content_block_stop
data: {"type":"content_block_stop","index":0}

event: content_block_start
data: {"type":"content_block_start","index":1,"content_block":{"type":"tool_use","id":"toolu_01T1x1fJ34qAmk2tNTrN7Up6","name":"get_weather","input":{}}}

event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":""}}

event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":"{\"location\":"}}

event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":" \"Сан"}}

event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":"-Франциск"}}

event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":"о,"}}

event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":" Калифорния\""}}

event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":", "}}

event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":"\"unit\": \"фар"}}

event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":"енгейт\"}"}}

event: content_block_stop
data: {"type":"content_block_stop","index":1}

event: message_delta
data: {"type":"message_delta","delta":{"stop_reason":"tool_use","stop_sequence":null},"usage":{"output_tokens":89}}

event: message_stop
data: {"type":"message_stop"}