Эффективное управление затратами
Узнайте, как отслеживать и оптимизировать использование токенов и затраты при использовании Claude Code.
Claude Code потребляет токены для каждого взаимодействия. Средняя стоимость составляет 12 для 90% пользователей.
Для командного использования Claude Code взимает плату за потребление токенов API. В среднем Claude Code стоит ~$50-60/разработчик в месяц с Sonnet 4, хотя существует большая вариативность в зависимости от того, сколько экземпляров запускают пользователи и используют ли они его в автоматизации.
Отслеживание ваших затрат
- Используйте
/cost
для просмотра использования текущей сессии - Пользователи Anthropic Console:
- Проверьте историческое использование в Anthropic Console (требуется роль Admin или Billing)
- Установите лимиты расходов рабочего пространства для рабочего пространства Claude Code (требуется роль Admin)
- Пользователи планов Pro и Max: Использование включено в вашу подписку
Управление затратами для команд
При использовании Anthropic API вы можете ограничить общие расходы рабочего пространства Claude Code. Для настройки следуйте этим инструкциям. Администраторы могут просматривать отчеты о затратах и использовании, следуя этим инструкциям.
На Bedrock и Vertex Claude Code не отправляет метрики из вашего облака. Чтобы получить метрики затрат, несколько крупных предприятий сообщили об использовании LiteLLM, который является инструментом с открытым исходным кодом, помогающим компаниям отслеживать расходы по ключу. Этот проект не связан с Anthropic, и мы не проводили аудит его безопасности.
Сокращение использования токенов
-
Компактные беседы:
-
Claude использует автоматическое сжатие по умолчанию, когда контекст превышает 95% емкости
-
Переключение автоматического сжатия: Запустите
/config
и перейдите к “Auto-compact enabled” -
Используйте
/compact
вручную, когда контекст становится большим -
Добавьте пользовательские инструкции:
/compact Focus on code samples and API usage
-
Настройте сжатие, добавив в CLAUDE.md:
-
-
Пишите конкретные запросы: Избегайте расплывчатых запросов, которые вызывают ненужное сканирование
-
Разбивайте сложные задачи: Разделяйте большие задачи на сфокусированные взаимодействия
-
Очищайте историю между задачами: Используйте
/clear
для сброса контекста
Затраты могут значительно варьироваться в зависимости от:
- Размера анализируемой кодовой базы
- Сложности запросов
- Количества файлов, которые ищутся или изменяются
- Длины истории беседы
- Частоты сжатия бесед
- Фоновых процессов (генерация хайку, суммаризация бесед)
Фоновое использование токенов
Claude Code использует токены для некоторых фоновых функций даже в режиме ожидания:
- Генерация хайку: Небольшие творческие сообщения, которые появляются во время набора текста (примерно 1 цент в день)
- Суммаризация бесед: Фоновые задачи, которые суммируют предыдущие беседы для функции
claude --resume
- Обработка команд: Некоторые команды, такие как
/cost
, могут генерировать запросы для проверки статуса
Эти фоновые процессы потребляют небольшое количество токенов (обычно менее $0.04 за сессию) даже без активного взаимодействия.
Для командных развертываний мы рекомендуем начинать с небольшой пилотной группы для установления паттернов использования перед более широким внедрением.