Lidando com razões de parada

Quando você faz uma solicitação para a API Messages, a resposta do Claude inclui um campo stop_reason que indica por que o modelo parou de gerar sua resposta. Compreender esses valores é crucial para construir aplicações robustas que lidam adequadamente com diferentes tipos de resposta. Para detalhes sobre stop_reason na resposta da API, consulte a referência da API Messages.

O que é stop_reason?

O campo stop_reason faz parte de toda resposta bem-sucedida da API Messages. Ao contrário dos erros, que indicam falhas no processamento de sua solicitação, stop_reason informa por que o Claude completou com sucesso a geração de sua resposta.

Example response

{
  "id": "msg_01234",
  "type": "message",
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "Here's the answer to your question..."
    }
  ],
  "stop_reason": "end_turn",
  "stop_sequence": null,
  "usage": {
    "input_tokens": 100,
    "output_tokens": 50
  }
}

Valores de razão de parada

end_turn

A razão de parada mais comum. Indica que o Claude terminou sua resposta naturalmente.

if response.stop_reason == "end_turn":
    # Process the complete response
    print(response.content[0].text)

max_tokens

O Claude parou porque atingiu o limite de max_tokens especificado em sua solicitação.

# Request with limited tokens
response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=10,
    messages=[{"role": "user", "content": "Explain quantum physics"}]
)

if response.stop_reason == "max_tokens":
    # Response was truncated
    print("Response was cut off at token limit")
    # Consider making another request to continue

stop_sequence

O Claude encontrou uma de suas sequências de parada personalizadas.

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    stop_sequences=["END", "STOP"],
    messages=[{"role": "user", "content": "Generate text until you say END"}]
)

if response.stop_reason == "stop_sequence":
    print(f"Stopped at sequence: {response.stop_sequence}")

tool_use

O Claude está chamando uma ferramenta e espera que você a execute.

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    tools=[weather_tool],
    messages=[{"role": "user", "content": "What's the weather?"}]
)

if response.stop_reason == "tool_use":
    # Extract and execute the tool
    for content in response.content:
        if content.type == "tool_use":
            result = execute_tool(content.name, content.input)
            # Return result to Claude for final response

pause_turn

Usado com ferramentas de servidor como busca na web quando o Claude precisa pausar uma operação de longa duração.

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    tools=[{"type": "web_search_20250305", "name": "web_search"}],
    messages=[{"role": "user", "content": "Search for latest AI news"}]
)

if response.stop_reason == "pause_turn":
    # Continue the conversation
    messages = [
        {"role": "user", "content": original_query},
        {"role": "assistant", "content": response.content}
    ]
    continuation = client.messages.create(
        model="claude-sonnet-4-20250514",
        messages=messages,
        tools=[{"type": "web_search_20250305", "name": "web_search"}]
    )

refusal

O Claude se recusou a gerar uma resposta devido a preocupações de segurança.

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    messages=[{"role": "user", "content": "[Unsafe request]"}]
)

if response.stop_reason == "refusal":
    # Claude declined to respond
    print("Claude was unable to process this request")
    # Consider rephrasing or modifying the request

Melhores práticas para lidar com razões de parada

1. Sempre verifique stop_reason

Torne um hábito verificar o stop_reason em sua lógica de tratamento de resposta:

def handle_response(response):
    if response.stop_reason == "tool_use":
        return handle_tool_use(response)
    elif response.stop_reason == "max_tokens":
        return handle_truncation(response)
    elif response.stop_reason == "pause_turn":
        return handle_pause(response)
    elif response.stop_reason == "refusal":
        return handle_refusal(response)
    else:
        # Handle end_turn and other cases
        return response.content[0].text

2. Lide com max_tokens graciosamente

Quando uma resposta é truncada devido a limites de token:

def handle_truncated_response(response):
    if response.stop_reason == "max_tokens":
        # Option 1: Warn the user
        return f"{response.content[0].text}\n\n[Response truncated due to length]"
        
        # Option 2: Continue generation
        messages = [
            {"role": "user", "content": original_prompt},
            {"role": "assistant", "content": response.content[0].text}
        ]
        continuation = client.messages.create(
            model="claude-sonnet-4-20250514",
            max_tokens=1024,
            messages=messages + [{"role": "user", "content": "Please continue"}]
        )
        return response.content[0].text + continuation.content[0].text

3. Implemente lógica de retry para pause_turn

Para ferramentas de servidor que podem pausar:

def handle_paused_conversation(initial_response, max_retries=3):
    response = initial_response
    messages = [{"role": "user", "content": original_query}]
    
    for attempt in range(max_retries):
        if response.stop_reason != "pause_turn":
            break
            
        messages.append({"role": "assistant", "content": response.content})
        response = client.messages.create(
            model="claude-sonnet-4-20250514",
            messages=messages,
            tools=original_tools
        )
    
    return response

Razões de parada vs. erros

É importante distinguir entre valores de stop_reason e erros reais:

Razões de parada (respostas bem-sucedidas)

Parte do corpo da resposta
Indicam por que a geração parou normalmente
A resposta contém conteúdo válido

Erros (solicitações falhadas)

Códigos de status HTTP 4xx ou 5xx
Indicam falhas no processamento da solicitação
A resposta contém detalhes do erro

try:
    response = client.messages.create(...)
    
    # Handle successful response with stop_reason
    if response.stop_reason == "max_tokens":
        print("Response was truncated")
    
except anthropic.APIError as e:
    # Handle actual errors
    if e.status_code == 429:
        print("Rate limit exceeded")
    elif e.status_code == 500:
        print("Server error")

Considerações sobre streaming

Ao usar streaming, stop_reason é:

null no evento inicial message_start
Fornecido no evento message_delta
Não fornecido em nenhum outro evento

with client.messages.stream(...) as stream:
    for event in stream:
        if event.type == "message_delta":
            stop_reason = event.delta.stop_reason
            if stop_reason:
                print(f"Stream ended with: {stop_reason}")

Padrões comuns

Lidando com fluxos de trabalho de uso de ferramentas

def complete_tool_workflow(client, user_query, tools):
    messages = [{"role": "user", "content": user_query}]
    
    while True:
        response = client.messages.create(
            model="claude-sonnet-4-20250514",
            messages=messages,
            tools=tools
        )
        
        if response.stop_reason == "tool_use":
            # Execute tools and continue
            tool_results = execute_tools(response.content)
            messages.append({"role": "assistant", "content": response.content})
            messages.append({"role": "user", "content": tool_results})
        else:
            # Final response
            return response

Garantindo respostas completas

def get_complete_response(client, prompt, max_attempts=3):
    messages = [{"role": "user", "content": prompt}]
    full_response = ""
    
    for _ in range(max_attempts):
        response = client.messages.create(
            model="claude-sonnet-4-20250514",
            messages=messages,
            max_tokens=4096
        )
        
        full_response += response.content[0].text
        
        if response.stop_reason != "max_tokens":
            break
            
        # Continue from where it left off
        messages = [
            {"role": "user", "content": prompt},
            {"role": "assistant", "content": full_response},
            {"role": "user", "content": "Please continue from where you left off."}
        ]
    
    return full_response

Ao lidar adequadamente com valores de stop_reason, você pode construir aplicações mais robustas que lidam graciosamente com diferentes cenários de resposta e fornecem melhores experiências do usuário.

Usando as APIs

Referência da API

SDKs

Exemplos

APIs de terceiros

Usando a API Admin

Suporte e configuração

Lidando com razões de parada

O que é stop_reason?

Valores de razão de parada

end_turn

max_tokens

stop_sequence

tool_use

pause_turn

refusal

Melhores práticas para lidar com razões de parada

1. Sempre verifique stop_reason

2. Lide com max_tokens graciosamente

3. Implemente lógica de retry para pause_turn

Razões de parada vs. erros

Razões de parada (respostas bem-sucedidas)

Erros (solicitações falhadas)

Considerações sobre streaming

Padrões comuns

Lidando com fluxos de trabalho de uso de ferramentas

Garantindo respostas completas

Usando as APIs

Referência da API

SDKs

Exemplos

APIs de terceiros

Usando a API Admin

Suporte e configuração

​O que é stop_reason?

​Valores de razão de parada

​end_turn

​max_tokens

​stop_sequence

​tool_use

​pause_turn

​refusal

​Melhores práticas para lidar com razões de parada

​1. Sempre verifique stop_reason

​2. Lide com max_tokens graciosamente

​3. Implemente lógica de retry para pause_turn

​Razões de parada vs. erros

​Razões de parada (respostas bem-sucedidas)

​Erros (solicitações falhadas)

​Considerações sobre streaming

​Padrões comuns

​Lidando com fluxos de trabalho de uso de ferramentas

​Garantindo respostas completas

O que é stop_reason?

Valores de razão de parada

end_turn

max_tokens

stop_sequence

tool_use

pause_turn

refusal

Melhores práticas para lidar com razões de parada

1. Sempre verifique stop_reason

2. Lide com max_tokens graciosamente

3. Implemente lógica de retry para pause_turn

Razões de parada vs. erros

Razões de parada (respostas bem-sucedidas)

Erros (solicitações falhadas)

Considerações sobre streaming

Padrões comuns

Lidando com fluxos de trabalho de uso de ferramentas

Garantindo respostas completas