Gérer les coûts efficacement
Apprenez à suivre et optimiser l’utilisation des tokens et les coûts lors de l’utilisation de Claude Code.
Claude Code consomme des tokens pour chaque interaction. Le coût moyen est de 6 pour 90 % des utilisateurs.
Pour l’utilisation en équipe, Claude Code facture selon la consommation de tokens API. En moyenne, Claude Code coûte environ 50-60 $/développeur par mois avec Sonnet 4, bien qu’il y ait une grande variance selon le nombre d’instances que les utilisateurs exécutent et s’ils l’utilisent dans l’automatisation.
Suivre vos coûts
- Utilisez
/cost
pour voir l’utilisation de la session actuelle - Utilisateurs de la Console Anthropic :
- Vérifiez l’utilisation historique dans la Console Anthropic (nécessite un rôle Admin ou Billing)
- Définissez les limites de dépenses de l’espace de travail pour l’espace de travail Claude Code (nécessite un rôle Admin)
- Utilisateurs des plans Pro et Max : L’utilisation est incluse dans votre abonnement
Gérer les coûts pour les équipes
Lors de l’utilisation de l’API Anthropic, vous pouvez limiter les dépenses totales de l’espace de travail Claude Code. Pour configurer, suivez ces instructions. Les administrateurs peuvent consulter les rapports de coûts et d’utilisation en suivant ces instructions.
Sur Bedrock et Vertex, Claude Code n’envoie pas de métriques depuis votre cloud. Afin d’obtenir des métriques de coûts, plusieurs grandes entreprises ont rapporté utiliser LiteLLM, qui est un outil open-source qui aide les entreprises à suivre les dépenses par clé. Ce projet n’est pas affilié à Anthropic et nous n’avons pas audité sa sécurité.
Réduire l’utilisation des tokens
-
Conversations compactes :
-
Claude utilise la compaction automatique par défaut lorsque le contexte dépasse 95 % de capacité
-
Basculer la compaction automatique : Exécutez
/config
et naviguez vers “Auto-compact enabled” -
Utilisez
/compact
manuellement lorsque le contexte devient important -
Ajoutez des instructions personnalisées :
/compact Focus on code samples and API usage
-
Personnalisez la compaction en ajoutant à CLAUDE.md :
-
-
Écrivez des requêtes spécifiques : Évitez les demandes vagues qui déclenchent un balayage inutile
-
Décomposez les tâches complexes : Divisez les grandes tâches en interactions ciblées
-
Effacez l’historique entre les tâches : Utilisez
/clear
pour réinitialiser le contexte
Les coûts peuvent varier considérablement selon :
- La taille de la base de code analysée
- La complexité des requêtes
- Le nombre de fichiers recherchés ou modifiés
- La longueur de l’historique de conversation
- La fréquence de compaction des conversations
- Les processus en arrière-plan (génération de haiku, résumé de conversation)
Utilisation des tokens en arrière-plan
Claude Code utilise des tokens pour certaines fonctionnalités en arrière-plan même en mode inactif :
- Génération de haiku : Petits messages créatifs qui apparaissent pendant que vous tapez (environ 1 cent par jour)
- Résumé de conversation : Tâches en arrière-plan qui résument les conversations précédentes pour la fonctionnalité
claude --resume
- Traitement des commandes : Certaines commandes comme
/cost
peuvent générer des requêtes pour vérifier le statut
Ces processus en arrière-plan consomment une petite quantité de tokens (généralement moins de 0,04 $ par session) même sans interaction active.
Pour les déploiements d’équipe, nous recommandons de commencer avec un petit groupe pilote pour établir les modèles d’utilisation avant un déploiement plus large.