비용을 효과적으로 관리하기
Claude Code를 사용할 때 토큰 사용량과 비용을 추적하고 최적화하는 방법을 알아보세요.
Claude Code는 각 상호작용마다 토큰을 소비합니다. 평균 비용은 개발자당 하루 12 미만으로 유지됩니다.
팀 사용의 경우, Claude Code는 API 토큰 소비량에 따라 요금을 부과합니다. 평균적으로 Claude Code는 Sonnet 4를 사용할 때 개발자당 월 ~$100-200의 비용이 들지만, 사용자가 실행하는 인스턴스 수와 자동화에서 사용하는지 여부에 따라 큰 차이가 있습니다.
비용 추적하기
/cost
를 사용하여 현재 세션 사용량 확인- Anthropic Console 사용자:
- Anthropic Console에서 과거 사용량 확인 (관리자 또는 청구 역할 필요)
- Claude Code 워크스페이스에 대한 워크스페이스 지출 한도 설정 (관리자 역할 필요)
- Pro 및 Max 플랜 사용자: 사용량이 구독에 포함됨
팀을 위한 비용 관리
Anthropic API를 사용할 때, Claude Code 워크스페이스의 총 지출을 제한할 수 있습니다. 구성하려면 이 지침을 따르세요. 관리자는 이 지침을 따라 비용 및 사용량 보고서를 볼 수 있습니다.
Bedrock과 Vertex에서는 Claude Code가 클라우드에서 메트릭을 전송하지 않습니다. 비용 메트릭을 얻기 위해 여러 대기업에서 LiteLLM을 사용한다고 보고했습니다. 이는 회사가 키별 지출을 추적하는 데 도움이 되는 오픈 소스 도구입니다. 이 프로젝트는 Anthropic과 관련이 없으며 보안을 감사하지 않았습니다.
속도 제한 권장사항
팀을 위해 Claude Code를 설정할 때, 조직 규모에 따른 사용자당 분당 토큰(TPM) 및 분당 요청(RPM) 권장사항을 고려하세요:
팀 규모 | 사용자당 TPM | 사용자당 RPM |
---|---|---|
1-5명 사용자 | 200k-300k | 5-7 |
5-20명 사용자 | 100k-150k | 2.5-3.5 |
20-50명 사용자 | 50k-75k | 1.25-1.75 |
50-100명 사용자 | 25k-35k | 0.62-0.87 |
100-500명 사용자 | 15k-20k | 0.37-0.47 |
500명 이상 사용자 | 10k-15k | 0.25-0.35 |
예를 들어, 200명의 사용자가 있다면 각 사용자에 대해 20k TPM을 요청할 수 있으며, 이는 총 400만 TPM입니다(200*20,000 = 400만).
사용자당 TPM은 팀 규모가 커질수록 감소하는데, 이는 더 큰 조직에서 동시에 Claude Code를 사용하는 사용자가 적을 것으로 예상하기 때문입니다. 이러한 속도 제한은 개별 사용자가 아닌 조직 수준에서 적용되므로, 다른 사용자가 적극적으로 서비스를 사용하지 않을 때 개별 사용자가 계산된 할당량보다 일시적으로 더 많이 소비할 수 있습니다.
대규모 그룹과의 라이브 교육 세션과 같이 비정상적으로 높은 동시 사용량이 예상되는 시나리오가 있다면, 사용자당 더 높은 TPM 할당이 필요할 수 있습니다.
토큰 사용량 줄이기
-
대화 압축:
-
Claude는 컨텍스트가 95% 용량을 초과할 때 기본적으로 자동 압축을 사용합니다
-
자동 압축 토글:
/config
를 실행하고 “Auto-compact enabled”로 이동 -
컨텍스트가 커질 때
/compact
를 수동으로 사용 -
사용자 지정 지침 추가:
/compact Focus on code samples and API usage
-
CLAUDE.md에 추가하여 압축 사용자 지정:
-
-
구체적인 쿼리 작성: 불필요한 스캔을 유발하는 모호한 요청 피하기
-
복잡한 작업 분해: 큰 작업을 집중된 상호작용으로 분할
-
작업 간 기록 지우기:
/clear
를 사용하여 컨텍스트 재설정
비용은 다음 요인에 따라 크게 달라질 수 있습니다:
- 분석되는 코드베이스의 크기
- 쿼리의 복잡성
- 검색하거나 수정되는 파일 수
- 대화 기록의 길이
- 대화 압축 빈도
- 백그라운드 프로세스 (하이쿠 생성, 대화 요약)
백그라운드 토큰 사용량
Claude Code는 유휴 상태일 때도 일부 백그라운드 기능을 위해 토큰을 사용합니다:
- 하이쿠 생성: 타이핑하는 동안 나타나는 작은 창의적 메시지 (하루 약 1센트)
- 대화 요약:
claude --resume
기능을 위해 이전 대화를 요약하는 백그라운드 작업 - 명령 처리:
/cost
와 같은 일부 명령은 상태 확인을 위한 요청을 생성할 수 있습니다
이러한 백그라운드 프로세스는 적극적인 상호작용 없이도 소량의 토큰(일반적으로 세션당 $0.04 미만)을 소비합니다.
팀 배포의 경우, 더 넓은 배포 전에 사용 패턴을 확립하기 위해 작은 파일럿 그룹으로 시작하는 것을 권장합니다.