Gestion des raisons d'arrêt

Lorsque vous faites une requête à l’API Messages, la réponse de Claude inclut un champ stop_reason qui indique pourquoi le modèle a arrêté de générer sa réponse. Comprendre ces valeurs est crucial pour construire des applications robustes qui gèrent différents types de réponses de manière appropriée.

Pour plus de détails sur stop_reason dans la réponse de l’API, consultez la référence de l’API Messages.

Qu’est-ce que stop_reason ?

Le champ stop_reason fait partie de chaque réponse réussie de l’API Messages. Contrairement aux erreurs, qui indiquent des échecs dans le traitement de votre requête, stop_reason vous indique pourquoi Claude a terminé avec succès la génération de sa réponse.

Exemple de réponse
{
  "id": "msg_01234",
  "type": "message",
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "Voici la réponse à votre question..."
    }
  ],
  "stop_reason": "end_turn",
  "stop_sequence": null,
  "usage": {
    "input_tokens": 100,
    "output_tokens": 50
  }
}

Valeurs de stop reason

end_turn

La raison d’arrêt la plus courante. Indique que Claude a terminé sa réponse naturellement.

if response.stop_reason == "end_turn":
    # Traiter la réponse complète
    print(response.content[0].text)

max_tokens

Claude s’est arrêté parce qu’il a atteint la limite max_tokens spécifiée dans votre requête.

# Requête avec des tokens limités
response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=10,
    messages=[{"role": "user", "content": "Expliquez la physique quantique"}]
)

if response.stop_reason == "max_tokens":
    # La réponse a été tronquée
    print("La réponse a été coupée à la limite de tokens")
    # Considérez faire une autre requête pour continuer

stop_sequence

Claude a rencontré une de vos séquences d’arrêt personnalisées.

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    stop_sequences=["FIN", "ARRÊT"],
    messages=[{"role": "user", "content": "Générez du texte jusqu'à ce que vous disiez FIN"}]
)

if response.stop_reason == "stop_sequence":
    print(f"Arrêté à la séquence : {response.stop_sequence}")

tool_use

Claude appelle un outil et s’attend à ce que vous l’exécutiez.

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    tools=[weather_tool],
    messages=[{"role": "user", "content": "Quel temps fait-il ?"}]
)

if response.stop_reason == "tool_use":
    # Extraire et exécuter l'outil
    for content in response.content:
        if content.type == "tool_use":
            result = execute_tool(content.name, content.input)
            # Retourner le résultat à Claude pour la réponse finale

pause_turn

Utilisé avec les outils serveur comme la recherche web lorsque Claude doit mettre en pause une opération de longue durée.

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    tools=[{"type": "web_search_20250305", "name": "web_search"}],
    messages=[{"role": "user", "content": "Recherchez les dernières nouvelles sur l'IA"}]
)

if response.stop_reason == "pause_turn":
    # Continuer la conversation
    messages = [
        {"role": "user", "content": original_query},
        {"role": "assistant", "content": response.content}
    ]
    continuation = client.messages.create(
        model="claude-sonnet-4-20250514",
        messages=messages,
        tools=[{"type": "web_search_20250305", "name": "web_search"}]
    )

refusal

Claude a refusé de générer une réponse en raison de préoccupations de sécurité.

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    messages=[{"role": "user", "content": "[Requête non sécurisée]"}]
)

if response.stop_reason == "refusal":
    # Claude a refusé de répondre
    print("Claude n'a pas pu traiter cette requête")
    # Considérez reformuler ou modifier la requête

Meilleures pratiques pour gérer les raisons d’arrêt

1. Toujours vérifier stop_reason

Prenez l’habitude de vérifier le stop_reason dans votre logique de gestion des réponses :

def handle_response(response):
    if response.stop_reason == "tool_use":
        return handle_tool_use(response)
    elif response.stop_reason == "max_tokens":
        return handle_truncation(response)
    elif response.stop_reason == "pause_turn":
        return handle_pause(response)
    elif response.stop_reason == "refusal":
        return handle_refusal(response)
    else:
        # Gérer end_turn et autres cas
        return response.content[0].text

2. Gérer max_tokens avec élégance

Lorsqu’une réponse est tronquée en raison des limites de tokens :

def handle_truncated_response(response):
    if response.stop_reason == "max_tokens":
        # Option 1 : Avertir l'utilisateur
        return f"{response.content[0].text}\n\n[Réponse tronquée en raison de la longueur]"
        
        # Option 2 : Continuer la génération
        messages = [
            {"role": "user", "content": original_prompt},
            {"role": "assistant", "content": response.content[0].text}
        ]
        continuation = client.messages.create(
            model="claude-sonnet-4-20250514",
            max_tokens=1024,
            messages=messages + [{"role": "user", "content": "Veuillez continuer"}]
        )
        return response.content[0].text + continuation.content[0].text

3. Implémenter une logique de nouvelle tentative pour pause_turn

Pour les outils serveur qui peuvent se mettre en pause :

def handle_paused_conversation(initial_response, max_retries=3):
    response = initial_response
    messages = [{"role": "user", "content": original_query}]
    
    for attempt in range(max_retries):
        if response.stop_reason != "pause_turn":
            break
            
        messages.append({"role": "assistant", "content": response.content})
        response = client.messages.create(
            model="claude-sonnet-4-20250514",
            messages=messages,
            tools=original_tools
        )
    
    return response

Stop reasons vs erreurs

Il est important de distinguer entre les valeurs stop_reason et les erreurs réelles :

Stop reasons (réponses réussies)

Partie du corps de la réponse
Indiquent pourquoi la génération s’est arrêtée normalement
La réponse contient du contenu valide

Erreurs (requêtes échouées)

Codes de statut HTTP 4xx ou 5xx
Indiquent des échecs de traitement de requête
La réponse contient des détails d’erreur

try:
    response = client.messages.create(...)
    
    # Gérer la réponse réussie avec stop_reason
    if response.stop_reason == "max_tokens":
        print("La réponse a été tronquée")
    
except anthropic.APIError as e:
    # Gérer les erreurs réelles
    if e.status_code == 429:
        print("Limite de taux dépassée")
    elif e.status_code == 500:
        print("Erreur serveur")

Considérations de streaming

Lors de l’utilisation du streaming, stop_reason est :

null dans l’événement initial message_start
Fourni dans l’événement message_delta
Non fourni dans aucun autre événement

with client.messages.stream(...) as stream:
    for event in stream:
        if event.type == "message_delta":
            stop_reason = event.delta.stop_reason
            if stop_reason:
                print(f"Le stream s'est terminé avec : {stop_reason}")

Modèles courants

Gestion des flux de travail d’utilisation d’outils

def complete_tool_workflow(client, user_query, tools):
    messages = [{"role": "user", "content": user_query}]
    
    while True:
        response = client.messages.create(
            model="claude-sonnet-4-20250514",
            messages=messages,
            tools=tools
        )
        
        if response.stop_reason == "tool_use":
            # Exécuter les outils et continuer
            tool_results = execute_tools(response.content)
            messages.append({"role": "assistant", "content": response.content})
            messages.append({"role": "user", "content": tool_results})
        else:
            # Réponse finale
            return response

Assurer des réponses complètes

def get_complete_response(client, prompt, max_attempts=3):
    messages = [{"role": "user", "content": prompt}]
    full_response = ""
    
    for _ in range(max_attempts):
        response = client.messages.create(
            model="claude-sonnet-4-20250514",
            messages=messages,
            max_tokens=4096
        )
        
        full_response += response.content[0].text
        
        if response.stop_reason != "max_tokens":
            break
            
        # Continuer à partir de là où ça s'est arrêté
        messages = [
            {"role": "user", "content": prompt},
            {"role": "assistant", "content": full_response},
            {"role": "user", "content": "Veuillez continuer à partir de là où vous vous êtes arrêté."}
        ]
    
    return full_response

En gérant correctement les valeurs stop_reason, vous pouvez construire des applications plus robustes qui gèrent avec élégance différents scénarios de réponse et offrent de meilleures expériences utilisateur.

Utilisation des API

Référence API

SDKs

Exemples

API tierces

Utilisation de l'API Admin

Support et configuration

Gestion des raisons d'arrêt

Qu’est-ce que stop_reason ?

Valeurs de stop reason

end_turn

max_tokens

stop_sequence

tool_use

pause_turn

refusal

Meilleures pratiques pour gérer les raisons d’arrêt

1. Toujours vérifier stop_reason

2. Gérer max_tokens avec élégance

3. Implémenter une logique de nouvelle tentative pour pause_turn

Stop reasons vs erreurs

Stop reasons (réponses réussies)

Erreurs (requêtes échouées)

Considérations de streaming

Modèles courants

Gestion des flux de travail d’utilisation d’outils

Assurer des réponses complètes

Utilisation des API

Référence API

SDKs

Exemples

API tierces

Utilisation de l'API Admin

Support et configuration

​Qu’est-ce que stop_reason ?

​Valeurs de stop reason

​end_turn

​max_tokens

​stop_sequence

​tool_use

​pause_turn

​refusal

​Meilleures pratiques pour gérer les raisons d’arrêt

​1. Toujours vérifier stop_reason

​2. Gérer max_tokens avec élégance

​3. Implémenter une logique de nouvelle tentative pour pause_turn

​Stop reasons vs erreurs

​Stop reasons (réponses réussies)

​Erreurs (requêtes échouées)

​Considérations de streaming

​Modèles courants

​Gestion des flux de travail d’utilisation d’outils

​Assurer des réponses complètes

Qu’est-ce que stop_reason ?

Valeurs de stop reason

end_turn

max_tokens

stop_sequence

tool_use

pause_turn

refusal

Meilleures pratiques pour gérer les raisons d’arrêt

1. Toujours vérifier stop_reason

2. Gérer max_tokens avec élégance

3. Implémenter une logique de nouvelle tentative pour pause_turn

Stop reasons vs erreurs

Stop reasons (réponses réussies)

Erreurs (requêtes échouées)

Considérations de streaming

Modèles courants

Gestion des flux de travail d’utilisation d’outils

Assurer des réponses complètes