Claude Code потребляет токены для каждого взаимодействия. Средняя стоимость составляет 6наразработчикавдень,приэтомежедневныезатратыостаютсяниже6 на разработчика в день, при этом ежедневные затраты остаются ниже 12 для 90% пользователей.

Для командного использования Claude Code взимает плату за потребление токенов API. В среднем Claude Code стоит ~$100-200/разработчик в месяц с Sonnet 4, хотя существует большая вариативность в зависимости от того, сколько экземпляров запускают пользователи и используют ли они его в автоматизации.

Отслеживание ваших затрат

  • Используйте /cost для просмотра использования текущей сессии
  • Пользователи Anthropic Console:
  • Пользователи планов Pro и Max: Использование включено в вашу подписку

Управление затратами для команд

При использовании Anthropic API вы можете ограничить общие расходы рабочего пространства Claude Code. Для настройки следуйте этим инструкциям. Администраторы могут просматривать отчеты о затратах и использовании, следуя этим инструкциям.

На Bedrock и Vertex Claude Code не отправляет метрики из вашего облака. Чтобы получить метрики затрат, несколько крупных предприятий сообщили об использовании LiteLLM, который является инструментом с открытым исходным кодом, помогающим компаниям отслеживать расходы по ключу. Этот проект не связан с Anthropic, и мы не проводили аудит его безопасности.

Рекомендации по ограничению скорости

При настройке Claude Code для команд рассмотрите эти рекомендации по Токенам в Минуту (TPM) и Запросам в Минуту (RPM) на пользователя в зависимости от размера вашей организации:

Размер командыTPM на пользователяRPM на пользователя
1-5 пользователей200k-300k5-7
5-20 пользователей100k-150k2.5-3.5
20-50 пользователей50k-75k1.25-1.75
50-100 пользователей25k-35k0.62-0.87
100-500 пользователей15k-20k0.37-0.47
500+ пользователей10k-15k0.25-0.35

Например, если у вас 200 пользователей, вы можете запросить 20k TPM для каждого пользователя, или 4 миллиона общих TPM (200*20,000 = 4 миллиона).

TPM на пользователя уменьшается по мере роста размера команды, потому что мы ожидаем, что меньше пользователей будут использовать Claude Code одновременно в более крупных организациях. Эти ограничения скорости применяются на уровне организации, а не для каждого отдельного пользователя, что означает, что отдельные пользователи могут временно потреблять больше своей расчетной доли, когда другие не используют сервис активно.

Если вы предвидите сценарии с необычно высоким одновременным использованием (например, живые тренинги с большими группами), вам могут потребоваться более высокие выделения TPM на пользователя.

Сокращение использования токенов

  • Компактные разговоры:

    • Claude использует автокомпактирование по умолчанию, когда контекст превышает 95% емкости

    • Переключить автокомпактирование: Запустите /config и перейдите к “Auto-compact enabled”

    • Используйте /compact вручную, когда контекст становится большим

    • Добавьте пользовательские инструкции: /compact Focus on code samples and API usage

    • Настройте компактирование, добавив в CLAUDE.md:

      # Summary instructions
      
      When you are using compact, please focus on test output and code changes
      
  • Пишите конкретные запросы: Избегайте расплывчатых запросов, которые вызывают ненужное сканирование

  • Разбивайте сложные задачи: Разделяйте большие задачи на сфокусированные взаимодействия

  • Очищайте историю между задачами: Используйте /clear для сброса контекста

Затраты могут значительно варьироваться в зависимости от:

  • Размера анализируемой кодовой базы
  • Сложности запросов
  • Количества файлов, которые ищутся или изменяются
  • Длины истории разговора
  • Частоты компактирования разговоров
  • Фоновых процессов (генерация хайку, суммаризация разговоров)

Фоновое использование токенов

Claude Code использует токены для некоторых фоновых функций даже в режиме ожидания:

  • Генерация хайку: Небольшие творческие сообщения, которые появляются во время набора текста (приблизительно 1 цент в день)
  • Суммаризация разговоров: Фоновые задачи, которые суммируют предыдущие разговоры для функции claude --resume
  • Обработка команд: Некоторые команды, такие как /cost, могут генерировать запросы для проверки статуса

Эти фоновые процессы потребляют небольшое количество токенов (обычно менее $0.04 за сессию) даже без активного взаимодействия.

Для командных развертываний мы рекомендуем начинать с небольшой пилотной группы для установления паттернов использования перед более широким внедрением.