Эффективное управление затратами
Узнайте, как отслеживать и оптимизировать использование токенов и затраты при использовании Claude Code.
Claude Code потребляет токены для каждого взаимодействия. Средняя стоимость составляет 12 для 90% пользователей.
Для командного использования Claude Code взимает плату за потребление токенов API. В среднем Claude Code стоит ~$100-200/разработчик в месяц с Sonnet 4, хотя существует большая вариативность в зависимости от того, сколько экземпляров запускают пользователи и используют ли они его в автоматизации.
Отслеживание ваших затрат
- Используйте
/cost
для просмотра использования текущей сессии - Пользователи Anthropic Console:
- Проверьте историческое использование в Anthropic Console (требуется роль Admin или Billing)
- Установите лимиты расходов рабочего пространства для рабочего пространства Claude Code (требуется роль Admin)
- Пользователи планов Pro и Max: Использование включено в вашу подписку
Управление затратами для команд
При использовании Anthropic API вы можете ограничить общие расходы рабочего пространства Claude Code. Для настройки следуйте этим инструкциям. Администраторы могут просматривать отчеты о затратах и использовании, следуя этим инструкциям.
На Bedrock и Vertex Claude Code не отправляет метрики из вашего облака. Чтобы получить метрики затрат, несколько крупных предприятий сообщили об использовании LiteLLM, который является инструментом с открытым исходным кодом, помогающим компаниям отслеживать расходы по ключу. Этот проект не связан с Anthropic, и мы не проводили аудит его безопасности.
Рекомендации по ограничению скорости
При настройке Claude Code для команд рассмотрите эти рекомендации по Токенам в Минуту (TPM) и Запросам в Минуту (RPM) на пользователя в зависимости от размера вашей организации:
Размер команды | TPM на пользователя | RPM на пользователя |
---|---|---|
1-5 пользователей | 200k-300k | 5-7 |
5-20 пользователей | 100k-150k | 2.5-3.5 |
20-50 пользователей | 50k-75k | 1.25-1.75 |
50-100 пользователей | 25k-35k | 0.62-0.87 |
100-500 пользователей | 15k-20k | 0.37-0.47 |
500+ пользователей | 10k-15k | 0.25-0.35 |
Например, если у вас 200 пользователей, вы можете запросить 20k TPM для каждого пользователя, или 4 миллиона общих TPM (200*20,000 = 4 миллиона).
TPM на пользователя уменьшается по мере роста размера команды, потому что мы ожидаем, что меньше пользователей будут использовать Claude Code одновременно в более крупных организациях. Эти ограничения скорости применяются на уровне организации, а не для каждого отдельного пользователя, что означает, что отдельные пользователи могут временно потреблять больше своей расчетной доли, когда другие не используют сервис активно.
Если вы предвидите сценарии с необычно высоким одновременным использованием (например, живые тренинги с большими группами), вам могут потребоваться более высокие выделения TPM на пользователя.
Сокращение использования токенов
-
Компактные разговоры:
-
Claude использует автокомпактирование по умолчанию, когда контекст превышает 95% емкости
-
Переключить автокомпактирование: Запустите
/config
и перейдите к “Auto-compact enabled” -
Используйте
/compact
вручную, когда контекст становится большим -
Добавьте пользовательские инструкции:
/compact Focus on code samples and API usage
-
Настройте компактирование, добавив в CLAUDE.md:
-
-
Пишите конкретные запросы: Избегайте расплывчатых запросов, которые вызывают ненужное сканирование
-
Разбивайте сложные задачи: Разделяйте большие задачи на сфокусированные взаимодействия
-
Очищайте историю между задачами: Используйте
/clear
для сброса контекста
Затраты могут значительно варьироваться в зависимости от:
- Размера анализируемой кодовой базы
- Сложности запросов
- Количества файлов, которые ищутся или изменяются
- Длины истории разговора
- Частоты компактирования разговоров
- Фоновых процессов (генерация хайку, суммаризация разговоров)
Фоновое использование токенов
Claude Code использует токены для некоторых фоновых функций даже в режиме ожидания:
- Генерация хайку: Небольшие творческие сообщения, которые появляются во время набора текста (приблизительно 1 цент в день)
- Суммаризация разговоров: Фоновые задачи, которые суммируют предыдущие разговоры для функции
claude --resume
- Обработка команд: Некоторые команды, такие как
/cost
, могут генерировать запросы для проверки статуса
Эти фоновые процессы потребляют небольшое количество токенов (обычно менее $0.04 за сессию) даже без активного взаимодействия.
Для командных развертываний мы рекомендуем начинать с небольшой пилотной группы для установления паттернов использования перед более широким внедрением.