Обработка причин остановки

Когда вы делаете запрос к Messages API, ответ Claude включает поле stop_reason, которое указывает, почему модель прекратила генерацию своего ответа. Понимание этих значений имеет решающее значение для создания надежных приложений, которые правильно обрабатывают различные типы ответов. Подробности о stop_reason в ответе API см. в справочнике Messages API.

Что такое stop_reason?

Поле stop_reason является частью каждого успешного ответа Messages API. В отличие от ошибок, которые указывают на сбои в обработке вашего запроса, stop_reason сообщает вам, почему Claude успешно завершил генерацию своего ответа.

Example response

{
  "id": "msg_01234",
  "type": "message",
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "Here's the answer to your question..."
    }
  ],
  "stop_reason": "end_turn",
  "stop_sequence": null,
  "usage": {
    "input_tokens": 100,
    "output_tokens": 50
  }
}

Значения причин остановки

end_turn

Наиболее распространенная причина остановки. Указывает, что Claude естественным образом завершил свой ответ.

if response.stop_reason == "end_turn":
    # Обработать полный ответ
    print(response.content[0].text)

max_tokens

Claude остановился, потому что достиг лимита max_tokens, указанного в вашем запросе.

# Запрос с ограниченными токенами
response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=10,
    messages=[{"role": "user", "content": "Explain quantum physics"}]
)

if response.stop_reason == "max_tokens":
    # Ответ был обрезан
    print("Response was cut off at token limit")
    # Рассмотрите возможность сделать еще один запрос для продолжения

stop_sequence

Claude встретил одну из ваших пользовательских последовательностей остановки.

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    stop_sequences=["END", "STOP"],
    messages=[{"role": "user", "content": "Generate text until you say END"}]
)

if response.stop_reason == "stop_sequence":
    print(f"Stopped at sequence: {response.stop_sequence}")

tool_use

Claude вызывает инструмент и ожидает, что вы его выполните.

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    tools=[weather_tool],
    messages=[{"role": "user", "content": "What's the weather?"}]
)

if response.stop_reason == "tool_use":
    # Извлечь и выполнить инструмент
    for content in response.content:
        if content.type == "tool_use":
            result = execute_tool(content.name, content.input)
            # Вернуть результат Claude для финального ответа

pause_turn

Используется с серверными инструментами, такими как веб-поиск, когда Claude нужно приостановить длительную операцию.

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    tools=[{"type": "web_search_20250305", "name": "web_search"}],
    messages=[{"role": "user", "content": "Search for latest AI news"}]
)

if response.stop_reason == "pause_turn":
    # Продолжить разговор
    messages = [
        {"role": "user", "content": original_query},
        {"role": "assistant", "content": response.content}
    ]
    continuation = client.messages.create(
        model="claude-sonnet-4-20250514",
        messages=messages,
        tools=[{"type": "web_search_20250305", "name": "web_search"}]
    )

refusal

Claude отказался генерировать ответ из соображений безопасности.

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    messages=[{"role": "user", "content": "[Unsafe request]"}]
)

if response.stop_reason == "refusal":
    # Claude отклонил ответ
    print("Claude was unable to process this request")
    # Рассмотрите возможность переформулировать или изменить запрос

Лучшие практики для обработки причин остановки

1. Всегда проверяйте stop_reason

Возьмите за привычку проверять stop_reason в логике обработки ответов:

def handle_response(response):
    if response.stop_reason == "tool_use":
        return handle_tool_use(response)
    elif response.stop_reason == "max_tokens":
        return handle_truncation(response)
    elif response.stop_reason == "pause_turn":
        return handle_pause(response)
    elif response.stop_reason == "refusal":
        return handle_refusal(response)
    else:
        # Обработать end_turn и другие случаи
        return response.content[0].text

2. Изящно обрабатывайте max_tokens

Когда ответ обрезан из-за лимитов токенов:

def handle_truncated_response(response):
    if response.stop_reason == "max_tokens":
        # Вариант 1: Предупредить пользователя
        return f"{response.content[0].text}\n\n[Response truncated due to length]"
        
        # Вариант 2: Продолжить генерацию
        messages = [
            {"role": "user", "content": original_prompt},
            {"role": "assistant", "content": response.content[0].text}
        ]
        continuation = client.messages.create(
            model="claude-sonnet-4-20250514",
            max_tokens=1024,
            messages=messages + [{"role": "user", "content": "Please continue"}]
        )
        return response.content[0].text + continuation.content[0].text

3. Реализуйте логику повтора для pause_turn

Для серверных инструментов, которые могут приостанавливаться:

def handle_paused_conversation(initial_response, max_retries=3):
    response = initial_response
    messages = [{"role": "user", "content": original_query}]
    
    for attempt in range(max_retries):
        if response.stop_reason != "pause_turn":
            break
            
        messages.append({"role": "assistant", "content": response.content})
        response = client.messages.create(
            model="claude-sonnet-4-20250514",
            messages=messages,
            tools=original_tools
        )
    
    return response

Причины остановки против ошибок

Важно различать значения stop_reason и фактические ошибки:

Причины остановки (успешные ответы)

Часть тела ответа
Указывают, почему генерация остановилась нормально
Ответ содержит действительный контент

Ошибки (неудачные запросы)

HTTP коды состояния 4xx или 5xx
Указывают на сбои обработки запроса
Ответ содержит детали ошибки

try:
    response = client.messages.create(...)
    
    # Обработать успешный ответ с stop_reason
    if response.stop_reason == "max_tokens":
        print("Response was truncated")
    
except anthropic.APIError as e:
    # Обработать фактические ошибки
    if e.status_code == 429:
        print("Rate limit exceeded")
    elif e.status_code == 500:
        print("Server error")

Соображения по потоковой передаче

При использовании потоковой передачи stop_reason:

null в начальном событии message_start
Предоставляется в событии message_delta
Не предоставляется в любых других событиях

with client.messages.stream(...) as stream:
    for event in stream:
        if event.type == "message_delta":
            stop_reason = event.delta.stop_reason
            if stop_reason:
                print(f"Stream ended with: {stop_reason}")

Общие паттерны

Обработка рабочих процессов использования инструментов

def complete_tool_workflow(client, user_query, tools):
    messages = [{"role": "user", "content": user_query}]
    
    while True:
        response = client.messages.create(
            model="claude-sonnet-4-20250514",
            messages=messages,
            tools=tools
        )
        
        if response.stop_reason == "tool_use":
            # Выполнить инструменты и продолжить
            tool_results = execute_tools(response.content)
            messages.append({"role": "assistant", "content": response.content})
            messages.append({"role": "user", "content": tool_results})
        else:
            # Финальный ответ
            return response

Обеспечение полных ответов

def get_complete_response(client, prompt, max_attempts=3):
    messages = [{"role": "user", "content": prompt}]
    full_response = ""
    
    for _ in range(max_attempts):
        response = client.messages.create(
            model="claude-sonnet-4-20250514",
            messages=messages,
            max_tokens=4096
        )
        
        full_response += response.content[0].text
        
        if response.stop_reason != "max_tokens":
            break
            
        # Продолжить с того места, где остановился
        messages = [
            {"role": "user", "content": prompt},
            {"role": "assistant", "content": full_response},
            {"role": "user", "content": "Please continue from where you left off."}
        ]
    
    return full_response

Правильно обрабатывая значения stop_reason, вы можете создавать более надежные приложения, которые изящно обрабатывают различные сценарии ответов и обеспечивают лучший пользовательский опыт.

Использование API

Справочник API

SDK

Примеры

API третьих сторон

Использование Admin API

Поддержка и настройка

Обработка причин остановки

Что такое stop_reason?

Значения причин остановки

end_turn

max_tokens

stop_sequence

tool_use

pause_turn

refusal

Лучшие практики для обработки причин остановки

1. Всегда проверяйте stop_reason

2. Изящно обрабатывайте max_tokens

3. Реализуйте логику повтора для pause_turn

Причины остановки против ошибок

Причины остановки (успешные ответы)

Ошибки (неудачные запросы)

Соображения по потоковой передаче

Общие паттерны

Обработка рабочих процессов использования инструментов

Обеспечение полных ответов

Использование API

Справочник API

SDK

Примеры

API третьих сторон

Использование Admin API

Поддержка и настройка

​Что такое stop_reason?

​Значения причин остановки

​end_turn

​max_tokens

​stop_sequence

​tool_use

​pause_turn

​refusal

​Лучшие практики для обработки причин остановки

​1. Всегда проверяйте stop_reason

​2. Изящно обрабатывайте max_tokens

​3. Реализуйте логику повтора для pause_turn

​Причины остановки против ошибок

​Причины остановки (успешные ответы)

​Ошибки (неудачные запросы)

​Соображения по потоковой передаче

​Общие паттерны

​Обработка рабочих процессов использования инструментов

​Обеспечение полных ответов

Что такое stop_reason?

Значения причин остановки

end_turn

max_tokens

stop_sequence

tool_use

pause_turn

refusal

Лучшие практики для обработки причин остановки

1. Всегда проверяйте stop_reason

2. Изящно обрабатывайте max_tokens

3. Реализуйте логику повтора для pause_turn

Причины остановки против ошибок

Причины остановки (успешные ответы)

Ошибки (неудачные запросы)

Соображения по потоковой передаче

Общие паттерны

Обработка рабочих процессов использования инструментов

Обеспечение полных ответов