사용량 및 비용 API
사용량 및 비용 관리자 API를 통해 조직의 API 사용량 및 비용 데이터에 프로그래밍 방식으로 액세스하세요.
The Admin API is unavailable for individual accounts. To collaborate with teammates and add members, set up your organization in Console → Settings → Organization.
사용량 및 비용 관리자 API는 조직의 과거 API 사용량 및 비용 데이터에 대한 프로그래밍 방식의 세분화된 액세스를 제공합니다. 이 데이터는 Anthropic Console의 사용량 및 비용 페이지에서 제공되는 정보와 유사합니다.
이 API를 통해 Claude 구현을 더 잘 모니터링, 분석 및 최적화할 수 있습니다:
- 정확한 사용량 추적: 응답 토큰 카운팅에만 의존하지 않고 정확한 토큰 수와 사용 패턴을 얻습니다
- 비용 조정: 재무 및 회계 팀을 위해 내부 기록을 Anthropic 청구서와 일치시킵니다
- 제품 성능 및 개선: 시스템 변경이 개선되었는지 측정하면서 제품 성능을 모니터링하거나 알림을 설정합니다
- 속도 제한 및 우선순위 계층 최적화: 프롬프트 캐싱이나 특정 프롬프트와 같은 기능을 최적화하여 할당된 용량을 최대한 활용하거나 전용 용량을 구매합니다.
- 고급 분석: Console에서 제공되는 것보다 더 깊은 데이터 분석을 수행합니다
관리자 API 키 필요
이 API는 관리자 API의 일부입니다. 이러한 엔드포인트는 표준 API 키와 다른 관리자 API 키(sk-ant-admin...
으로 시작)가 필요합니다. 관리자 역할을 가진 조직 구성원만 Anthropic Console을 통해 관리자 API 키를 프로비저닝할 수 있습니다.
파트너 솔루션
선도적인 관찰 가능성 플랫폼은 사용자 정의 코드를 작성하지 않고도 Claude API 사용량과 비용을 모니터링할 수 있는 즉시 사용 가능한 통합을 제공합니다. 이러한 통합은 API 사용량을 효과적으로 관리하는 데 도움이 되는 대시보드, 알림 및 분석을 제공합니다.
Datadog
자동 추적 및 모니터링을 통한 LLM 관찰 가능성
Grafana Cloud
기본 제공 대시보드 및 알림을 통한 쉬운 LLM 관찰 가능성을 위한 에이전트리스 통합
Honeycomb
OpenTelemetry를 통한 고급 쿼리 및 시각화
빠른 시작
지난 7일간 조직의 일일 사용량을 가져옵니다:
통합을 위한 User-Agent 헤더 설정
통합을 구축하는 경우 사용 패턴을 이해하는 데 도움이 되도록 User-Agent 헤더를 설정하세요:
사용량 API
/v1/organizations/usage_report/messages
엔드포인트를 통해 모델, 작업 공간 및 서비스 계층별 세부 분석으로 조직 전체의 토큰 소비를 추적합니다.
주요 개념
- 시간 버킷: 고정 간격(
1m
,1h
또는1d
)으로 사용량 데이터를 집계합니다 - 토큰 추적: 캐시되지 않은 입력, 캐시된 입력, 캐시 생성 및 출력 토큰을 측정합니다
- 필터링 및 그룹화: API 키, 작업 공간, 모델, 서비스 계층 또는 컨텍스트 창으로 필터링하고 이러한 차원으로 결과를 그룹화합니다
- 서버 도구 사용량: 웹 검색과 같은 서버 측 도구의 사용량을 추적합니다
완전한 매개변수 세부 정보 및 응답 스키마는 사용량 API 참조를 참조하세요.
기본 예제
모델별 일일 사용량
필터링을 통한 시간별 사용량
시간 세분성 제한
세분성 | 기본 제한 | 최대 제한 | 사용 사례 |
---|---|---|---|
1m | 60 버킷 | 1440 버킷 | 실시간 모니터링 |
1h | 24 버킷 | 168 버킷 | 일일 패턴 |
1d | 7 버킷 | 31 버킷 | 주간/월간 보고서 |
비용 API
/v1/organizations/cost_report
엔드포인트를 통해 USD 단위의 서비스 수준 비용 분석을 검색합니다.
주요 개념
- 통화: 모든 비용은 USD로 표시되며 최소 단위(센트)의 십진수 문자열로 보고됩니다
- 비용 유형: 토큰 사용량, 웹 검색 및 코드 실행 비용을 추적합니다
- 그룹화: 세부 분석을 위해 작업 공간 또는 설명별로 비용을 그룹화합니다
- 시간 버킷: 일일 세분성만 가능(
1d
)
완전한 매개변수 세부 정보 및 응답 스키마는 비용 API 참조를 참조하세요.
우선순위 계층 비용은 다른 청구 모델을 사용하며 비용 엔드포인트에 포함되지 않습니다. 대신 사용량 엔드포인트를 통해 우선순위 계층 사용량을 추적하세요.
기본 예제
페이지네이션
두 엔드포인트 모두 대용량 데이터셋에 대한 페이지네이션을 지원합니다:
- 초기 요청을 만듭니다
has_more
가true
인 경우 다음 요청에서next_page
값을 사용합니다has_more
가false
가 될 때까지 계속합니다
일반적인 사용 사례
anthropic-cookbook에서 세부 구현을 살펴보세요:
- 일일 사용량 보고서: 토큰 소비 추세 추적
- 비용 귀속: 차지백을 위한 작업 공간별 비용 할당
- 캐시 효율성: 프롬프트 캐싱 측정 및 최적화
- 예산 모니터링: 지출 임계값에 대한 알림 설정
- CSV 내보내기: 재무 팀을 위한 보고서 생성
자주 묻는 질문
데이터는 얼마나 최신입니까?
사용량 및 비용 데이터는 일반적으로 API 요청 완료 후 5분 이내에 나타나지만 때때로 지연이 더 길 수 있습니다.
권장 폴링 빈도는 무엇입니까?
API는 지속적인 사용을 위해 분당 한 번 폴링을 지원합니다. 짧은 버스트(예: 페이지네이션된 데이터 다운로드)의 경우 더 빈번한 폴링이 허용됩니다. 자주 업데이트가 필요한 대시보드의 경우 결과를 캐시하세요.
코드 실행 사용량을 어떻게 추적합니까?
코드 실행 비용은 설명 필드에서 Code Execution Usage
아래에 그룹화되어 비용 엔드포인트에 나타납니다. 코드 실행은 사용량 엔드포인트에 포함되지 않습니다.
우선순위 계층 사용량을 어떻게 추적합니까?
사용량 엔드포인트에서 service_tier
로 필터링하거나 그룹화하고 priority
값을 찾으세요. 우선순위 계층 비용은 비용 엔드포인트에서 사용할 수 없습니다.
Workbench 사용량은 어떻게 됩니까?
Workbench의 API 사용량은 API 키와 연결되지 않으므로 해당 차원으로 그룹화할 때도 api_key_id
는 null
이 됩니다.
기본 작업 공간은 어떻게 표현됩니까?
기본 작업 공간에 귀속된 사용량 및 비용은 workspace_id
에 대해 null
값을 가집니다.
참고 항목
사용량 및 비용 API는 사용자에게 더 나은 경험을 제공하고, 비용을 관리하며, 속도 제한을 보존하는 데 도움이 될 수 있습니다. 이러한 다른 기능들에 대해 자세히 알아보세요:
- 관리자 API 개요
- 관리자 API 참조
- 가격 책정
- 프롬프트 캐싱 - 캐싱으로 비용 최적화
- 배치 처리 - 배치 요청에 대한 50% 할인
- 속도 제한 - 사용량 계층 이해