Gestione dei motivi di arresto

Quando fai una richiesta all’API Messages, la risposta di Claude include un campo stop_reason che indica perché il modello ha smesso di generare la sua risposta. Comprendere questi valori è cruciale per costruire applicazioni robuste che gestiscano appropriatamente diversi tipi di risposta. Per dettagli su stop_reason nella risposta dell’API, vedi il riferimento API Messages.

Cos’è stop_reason?

Il campo stop_reason fa parte di ogni risposta di successo dell’API Messages. A differenza degli errori, che indicano fallimenti nell’elaborazione della tua richiesta, stop_reason ti dice perché Claude ha completato con successo la generazione della sua risposta.

Example response

{
  "id": "msg_01234",
  "type": "message",
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "Here's the answer to your question..."
    }
  ],
  "stop_reason": "end_turn",
  "stop_sequence": null,
  "usage": {
    "input_tokens": 100,
    "output_tokens": 50
  }
}

Valori del motivo di arresto

end_turn

Il motivo di arresto più comune. Indica che Claude ha finito la sua risposta naturalmente.

if response.stop_reason == "end_turn":
    # Elabora la risposta completa
    print(response.content[0].text)

max_tokens

Claude si è fermato perché ha raggiunto il limite max_tokens specificato nella tua richiesta.

# Richiesta con token limitati
response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=10,
    messages=[{"role": "user", "content": "Explain quantum physics"}]
)

if response.stop_reason == "max_tokens":
    # La risposta è stata troncata
    print("Response was cut off at token limit")
    # Considera di fare un'altra richiesta per continuare

stop_sequence

Claude ha incontrato una delle tue sequenze di arresto personalizzate.

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    stop_sequences=["END", "STOP"],
    messages=[{"role": "user", "content": "Generate text until you say END"}]
)

if response.stop_reason == "stop_sequence":
    print(f"Stopped at sequence: {response.stop_sequence}")

tool_use

Claude sta chiamando uno strumento e si aspetta che tu lo esegua.

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    tools=[weather_tool],
    messages=[{"role": "user", "content": "What's the weather?"}]
)

if response.stop_reason == "tool_use":
    # Estrai ed esegui lo strumento
    for content in response.content:
        if content.type == "tool_use":
            result = execute_tool(content.name, content.input)
            # Restituisci il risultato a Claude per la risposta finale

pause_turn

Utilizzato con strumenti server come la ricerca web quando Claude deve mettere in pausa un’operazione di lunga durata.

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    tools=[{"type": "web_search_20250305", "name": "web_search"}],
    messages=[{"role": "user", "content": "Search for latest AI news"}]
)

if response.stop_reason == "pause_turn":
    # Continua la conversazione
    messages = [
        {"role": "user", "content": original_query},
        {"role": "assistant", "content": response.content}
    ]
    continuation = client.messages.create(
        model="claude-sonnet-4-20250514",
        messages=messages,
        tools=[{"type": "web_search_20250305", "name": "web_search"}]
    )

refusal

Claude ha rifiutato di generare una risposta a causa di preoccupazioni di sicurezza.

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    messages=[{"role": "user", "content": "[Unsafe request]"}]
)

if response.stop_reason == "refusal":
    # Claude ha rifiutato di rispondere
    print("Claude was unable to process this request")
    # Considera di riformulare o modificare la richiesta

Migliori pratiche per gestire i motivi di arresto

1. Controlla sempre stop_reason

Prendi l’abitudine di controllare il stop_reason nella tua logica di gestione delle risposte:

def handle_response(response):
    if response.stop_reason == "tool_use":
        return handle_tool_use(response)
    elif response.stop_reason == "max_tokens":
        return handle_truncation(response)
    elif response.stop_reason == "pause_turn":
        return handle_pause(response)
    elif response.stop_reason == "refusal":
        return handle_refusal(response)
    else:
        # Gestisci end_turn e altri casi
        return response.content[0].text

2. Gestisci max_tokens con grazia

Quando una risposta è troncata a causa dei limiti di token:

def handle_truncated_response(response):
    if response.stop_reason == "max_tokens":
        # Opzione 1: Avvisa l'utente
        return f"{response.content[0].text}\n\n[Response truncated due to length]"
        
        # Opzione 2: Continua la generazione
        messages = [
            {"role": "user", "content": original_prompt},
            {"role": "assistant", "content": response.content[0].text}
        ]
        continuation = client.messages.create(
            model="claude-sonnet-4-20250514",
            max_tokens=1024,
            messages=messages + [{"role": "user", "content": "Please continue"}]
        )
        return response.content[0].text + continuation.content[0].text

3. Implementa logica di ripetizione per pause_turn

Per strumenti server che potrebbero mettere in pausa:

def handle_paused_conversation(initial_response, max_retries=3):
    response = initial_response
    messages = [{"role": "user", "content": original_query}]
    
    for attempt in range(max_retries):
        if response.stop_reason != "pause_turn":
            break
            
        messages.append({"role": "assistant", "content": response.content})
        response = client.messages.create(
            model="claude-sonnet-4-20250514",
            messages=messages,
            tools=original_tools
        )
    
    return response

Motivi di arresto vs. errori

È importante distinguere tra valori stop_reason ed errori effettivi:

Motivi di arresto (risposte di successo)

Parte del corpo della risposta
Indicano perché la generazione si è fermata normalmente
La risposta contiene contenuto valido

Errori (richieste fallite)

Codici di stato HTTP 4xx o 5xx
Indicano fallimenti nell’elaborazione delle richieste
La risposta contiene dettagli dell’errore

try:
    response = client.messages.create(...)
    
    # Gestisci risposta di successo con stop_reason
    if response.stop_reason == "max_tokens":
        print("Response was truncated")
    
except anthropic.APIError as e:
    # Gestisci errori effettivi
    if e.status_code == 429:
        print("Rate limit exceeded")
    elif e.status_code == 500:
        print("Server error")

Considerazioni sullo streaming

Quando usi lo streaming, stop_reason è:

null nell’evento iniziale message_start
Fornito nell’evento message_delta
Non fornito in nessun altro evento

with client.messages.stream(...) as stream:
    for event in stream:
        if event.type == "message_delta":
            stop_reason = event.delta.stop_reason
            if stop_reason:
                print(f"Stream ended with: {stop_reason}")

Modelli comuni

Gestione dei flussi di lavoro degli strumenti

def complete_tool_workflow(client, user_query, tools):
    messages = [{"role": "user", "content": user_query}]
    
    while True:
        response = client.messages.create(
            model="claude-sonnet-4-20250514",
            messages=messages,
            tools=tools
        )
        
        if response.stop_reason == "tool_use":
            # Esegui strumenti e continua
            tool_results = execute_tools(response.content)
            messages.append({"role": "assistant", "content": response.content})
            messages.append({"role": "user", "content": tool_results})
        else:
            # Risposta finale
            return response

Assicurare risposte complete

def get_complete_response(client, prompt, max_attempts=3):
    messages = [{"role": "user", "content": prompt}]
    full_response = ""
    
    for _ in range(max_attempts):
        response = client.messages.create(
            model="claude-sonnet-4-20250514",
            messages=messages,
            max_tokens=4096
        )
        
        full_response += response.content[0].text
        
        if response.stop_reason != "max_tokens":
            break
            
        # Continua da dove si era fermato
        messages = [
            {"role": "user", "content": prompt},
            {"role": "assistant", "content": full_response},
            {"role": "user", "content": "Please continue from where you left off."}
        ]
    
    return full_response

Gestendo correttamente i valori stop_reason, puoi costruire applicazioni più robuste che gestiscono con grazia diversi scenari di risposta e forniscono migliori esperienze utente.

Utilizzo delle API

Riferimento API

SDK

Esempi

API di terze parti

Utilizzo dell'API Admin

Supporto e configurazione

Gestione dei motivi di arresto

Cos’è stop_reason?

Valori del motivo di arresto

end_turn

max_tokens

stop_sequence

tool_use

pause_turn

refusal

Migliori pratiche per gestire i motivi di arresto

1. Controlla sempre stop_reason

2. Gestisci max_tokens con grazia

3. Implementa logica di ripetizione per pause_turn

Motivi di arresto vs. errori

Motivi di arresto (risposte di successo)

Errori (richieste fallite)

Considerazioni sullo streaming

Modelli comuni

Gestione dei flussi di lavoro degli strumenti

Assicurare risposte complete

Utilizzo delle API

Riferimento API

SDK

Esempi

API di terze parti

Utilizzo dell'API Admin

Supporto e configurazione

​Cos’è stop_reason?

​Valori del motivo di arresto

​end_turn

​max_tokens

​stop_sequence

​tool_use

​pause_turn

​refusal

​Migliori pratiche per gestire i motivi di arresto

​1. Controlla sempre stop_reason

​2. Gestisci max_tokens con grazia

​3. Implementa logica di ripetizione per pause_turn

​Motivi di arresto vs. errori

​Motivi di arresto (risposte di successo)

​Errori (richieste fallite)

​Considerazioni sullo streaming

​Modelli comuni

​Gestione dei flussi di lavoro degli strumenti

​Assicurare risposte complete

Cos’è stop_reason?

Valori del motivo di arresto

end_turn

max_tokens

stop_sequence

tool_use

pause_turn

refusal

Migliori pratiche per gestire i motivi di arresto

1. Controlla sempre stop_reason

2. Gestisci max_tokens con grazia

3. Implementa logica di ripetizione per pause_turn

Motivi di arresto vs. errori

Motivi di arresto (risposte di successo)

Errori (richieste fallite)

Considerazioni sullo streaming

Modelli comuni

Gestione dei flussi di lavoro degli strumenti

Assicurare risposte complete