Claude Code consume tokens por cada interacción. El costo promedio es de 6pordesarrolladorpordıˊa,concostosdiariosquesemantienenpordebajode6 por desarrollador por día, con costos diarios que se mantienen por debajo de 12 para el 90% de los usuarios.

Para uso en equipo, Claude Code cobra por consumo de tokens de API. En promedio, Claude Code cuesta ~$50-60/desarrollador por mes con Sonnet 4, aunque hay una gran variación dependiendo de cuántas instancias estén ejecutando los usuarios y si lo están usando en automatización.

Rastrea tus costos

  • Usa /cost para ver el uso de la sesión actual
  • Usuarios de Anthropic Console:
  • Usuarios de planes Pro y Max: El uso está incluido en tu suscripción

Gestión de costos para equipos

Al usar la API de Anthropic, puedes limitar el gasto total del workspace de Claude Code. Para configurar, sigue estas instrucciones. Los administradores pueden ver reportes de costos y uso siguiendo estas instrucciones.

En Bedrock y Vertex, Claude Code no envía métricas desde tu nube. Para obtener métricas de costos, varias empresas grandes reportaron usar LiteLLM, que es una herramienta de código abierto que ayuda a las empresas a rastrear gastos por clave. Este proyecto no está afiliado con Anthropic y no hemos auditado su seguridad.

Reduce el uso de tokens

  • Conversaciones compactas:

    • Claude usa auto-compactar por defecto cuando el contexto excede el 95% de capacidad

    • Alternar auto-compactar: Ejecuta /config y navega a “Auto-compact enabled”

    • Usa /compact manualmente cuando el contexto se vuelva grande

    • Agrega instrucciones personalizadas: /compact Focus on code samples and API usage

    • Personaliza la compactación agregando a CLAUDE.md:

      # Summary instructions
      
      When you are using compact, please focus on test output and code changes
      
  • Escribe consultas específicas: Evita solicitudes vagas que desencadenen escaneo innecesario

  • Divide tareas complejas: Separa tareas grandes en interacciones enfocadas

  • Limpia el historial entre tareas: Usa /clear para reiniciar el contexto

Los costos pueden variar significativamente basándose en:

  • Tamaño de la base de código siendo analizada
  • Complejidad de las consultas
  • Número de archivos siendo buscados o modificados
  • Longitud del historial de conversación
  • Frecuencia de compactación de conversaciones
  • Procesos en segundo plano (generación de haiku, resumen de conversaciones)

Uso de tokens en segundo plano

Claude Code usa tokens para algunas funcionalidades en segundo plano incluso cuando está inactivo:

  • Generación de haiku: Pequeños mensajes creativos que aparecen mientras escribes (aproximadamente 1 centavo por día)
  • Resumen de conversaciones: Trabajos en segundo plano que resumen conversaciones previas para la función claude --resume
  • Procesamiento de comandos: Algunos comandos como /cost pueden generar solicitudes para verificar el estado

Estos procesos en segundo plano consumen una pequeña cantidad de tokens (típicamente menos de $0.04 por sesión) incluso sin interacción activa.

Para despliegues de equipo, recomendamos comenzar con un pequeño grupo piloto para establecer patrones de uso antes de un despliegue más amplio.