Gestiona los costos de manera efectiva
Aprende cómo rastrear y optimizar el uso de tokens y costos al usar Claude Code.
Claude Code consume tokens por cada interacción. El costo promedio es de 12 para el 90% de los usuarios.
Para uso en equipo, Claude Code cobra por consumo de tokens de API. En promedio, Claude Code cuesta ~$50-60/desarrollador por mes con Sonnet 4, aunque hay una gran variación dependiendo de cuántas instancias estén ejecutando los usuarios y si lo están usando en automatización.
Rastrea tus costos
- Usa
/cost
para ver el uso de la sesión actual - Usuarios de Anthropic Console:
- Revisa el uso histórico en Anthropic Console (requiere rol de Admin o Billing)
- Establece límites de gasto del workspace para el workspace de Claude Code (requiere rol de Admin)
- Usuarios de planes Pro y Max: El uso está incluido en tu suscripción
Gestión de costos para equipos
Al usar la API de Anthropic, puedes limitar el gasto total del workspace de Claude Code. Para configurar, sigue estas instrucciones. Los administradores pueden ver reportes de costos y uso siguiendo estas instrucciones.
En Bedrock y Vertex, Claude Code no envía métricas desde tu nube. Para obtener métricas de costos, varias empresas grandes reportaron usar LiteLLM, que es una herramienta de código abierto que ayuda a las empresas a rastrear gastos por clave. Este proyecto no está afiliado con Anthropic y no hemos auditado su seguridad.
Reduce el uso de tokens
-
Conversaciones compactas:
-
Claude usa auto-compactar por defecto cuando el contexto excede el 95% de capacidad
-
Alternar auto-compactar: Ejecuta
/config
y navega a “Auto-compact enabled” -
Usa
/compact
manualmente cuando el contexto se vuelva grande -
Agrega instrucciones personalizadas:
/compact Focus on code samples and API usage
-
Personaliza la compactación agregando a CLAUDE.md:
-
-
Escribe consultas específicas: Evita solicitudes vagas que desencadenen escaneo innecesario
-
Divide tareas complejas: Separa tareas grandes en interacciones enfocadas
-
Limpia el historial entre tareas: Usa
/clear
para reiniciar el contexto
Los costos pueden variar significativamente basándose en:
- Tamaño de la base de código siendo analizada
- Complejidad de las consultas
- Número de archivos siendo buscados o modificados
- Longitud del historial de conversación
- Frecuencia de compactación de conversaciones
- Procesos en segundo plano (generación de haiku, resumen de conversaciones)
Uso de tokens en segundo plano
Claude Code usa tokens para algunas funcionalidades en segundo plano incluso cuando está inactivo:
- Generación de haiku: Pequeños mensajes creativos que aparecen mientras escribes (aproximadamente 1 centavo por día)
- Resumen de conversaciones: Trabajos en segundo plano que resumen conversaciones previas para la función
claude --resume
- Procesamiento de comandos: Algunos comandos como
/cost
pueden generar solicitudes para verificar el estado
Estos procesos en segundo plano consumen una pequeña cantidad de tokens (típicamente menos de $0.04 por sesión) incluso sin interacción activa.
Para despliegues de equipo, recomendamos comenzar con un pequeño grupo piloto para establecer patrones de uso antes de un despliegue más amplio.