Claude Code consomme des tokens pour chaque interaction. Le coût moyen est de 6 pardeˊveloppeurparjour,avecdescou^tsquotidiensrestantinfeˊrieursaˋ12par développeur par jour, avec des coûts quotidiens restant inférieurs à 12 pour 90 % des utilisateurs.

Pour l’utilisation en équipe, Claude Code facture selon la consommation de tokens API. En moyenne, Claude Code coûte environ 50-60 $/développeur par mois avec Sonnet 4, bien qu’il y ait une grande variance selon le nombre d’instances que les utilisateurs exécutent et s’ils l’utilisent dans l’automatisation.

Suivre vos coûts

  • Utilisez /cost pour voir l’utilisation de la session actuelle
  • Utilisateurs de la Console Anthropic :
  • Utilisateurs des plans Pro et Max : L’utilisation est incluse dans votre abonnement

Gérer les coûts pour les équipes

Lors de l’utilisation de l’API Anthropic, vous pouvez limiter les dépenses totales de l’espace de travail Claude Code. Pour configurer, suivez ces instructions. Les administrateurs peuvent consulter les rapports de coûts et d’utilisation en suivant ces instructions.

Sur Bedrock et Vertex, Claude Code n’envoie pas de métriques depuis votre cloud. Afin d’obtenir des métriques de coûts, plusieurs grandes entreprises ont rapporté utiliser LiteLLM, qui est un outil open-source qui aide les entreprises à suivre les dépenses par clé. Ce projet n’est pas affilié à Anthropic et nous n’avons pas audité sa sécurité.

Réduire l’utilisation des tokens

  • Conversations compactes :

    • Claude utilise la compaction automatique par défaut lorsque le contexte dépasse 95 % de capacité

    • Basculer la compaction automatique : Exécutez /config et naviguez vers “Auto-compact enabled”

    • Utilisez /compact manuellement lorsque le contexte devient important

    • Ajoutez des instructions personnalisées : /compact Focus on code samples and API usage

    • Personnalisez la compaction en ajoutant à CLAUDE.md :

      # Instructions de résumé
      
      Lorsque vous utilisez compact, veuillez vous concentrer sur la sortie des tests et les modifications de code
      
  • Écrivez des requêtes spécifiques : Évitez les demandes vagues qui déclenchent un balayage inutile

  • Décomposez les tâches complexes : Divisez les grandes tâches en interactions ciblées

  • Effacez l’historique entre les tâches : Utilisez /clear pour réinitialiser le contexte

Les coûts peuvent varier considérablement selon :

  • La taille de la base de code analysée
  • La complexité des requêtes
  • Le nombre de fichiers recherchés ou modifiés
  • La longueur de l’historique de conversation
  • La fréquence de compaction des conversations
  • Les processus en arrière-plan (génération de haiku, résumé de conversation)

Utilisation des tokens en arrière-plan

Claude Code utilise des tokens pour certaines fonctionnalités en arrière-plan même en mode inactif :

  • Génération de haiku : Petits messages créatifs qui apparaissent pendant que vous tapez (environ 1 cent par jour)
  • Résumé de conversation : Tâches en arrière-plan qui résument les conversations précédentes pour la fonctionnalité claude --resume
  • Traitement des commandes : Certaines commandes comme /cost peuvent générer des requêtes pour vérifier le statut

Ces processus en arrière-plan consomment une petite quantité de tokens (généralement moins de 0,04 $ par session) même sans interaction active.

Pour les déploiements d’équipe, nous recommandons de commencer avec un petit groupe pilote pour établir les modèles d’utilisation avant un déploiement plus large.