使用量とコストAPI
使用量とコスト管理APIを使用して、組織のAPI使用量とコストデータにプログラム的にアクセスできます。
The Admin API is unavailable for individual accounts. To collaborate with teammates and add members, set up your organization in Console → Settings → Organization.
使用量とコスト管理APIは、組織の過去のAPI使用量とコストデータへのプログラム的で詳細なアクセスを提供します。このデータは、Anthropic Consoleの使用量とコストページで利用可能な情報と類似しています。
このAPIにより、Claudeの実装をより良く監視、分析、最適化できます:
- 正確な使用量追跡: レスポンストークンカウントのみに依存するのではなく、正確なトークン数と使用パターンを取得
- コスト照合: 財務・会計チームのために内部記録とAnthropicの請求を照合
- 製品パフォーマンスと改善: システムへの変更が改善されたかどうかを測定しながら製品パフォーマンスを監視、またはアラートを設定
- レート制限と優先ティアの最適化: プロンプトキャッシュや特定のプロンプトなどの機能を最適化して、割り当てられた容量を最大限に活用、または専用容量を購入
- 高度な分析: Consoleで利用可能なものよりも深いデータ分析を実行
管理APIキーが必要
このAPIは管理APIの一部です。これらのエンドポイントには、標準のAPIキーとは異なる管理APIキー(sk-ant-admin...
で始まる)が必要です。管理者ロールを持つ組織メンバーのみが、Anthropic Consoleを通じて管理APIキーをプロビジョニングできます。
パートナーソリューション
主要な可観測性プラットフォームは、カスタムコードを書くことなく、Claude APIの使用量とコストを監視するための即座に使用可能な統合を提供しています。これらの統合は、API使用量を効果的に管理するためのダッシュボード、アラート、分析を提供します。
Datadog
自動トレースと監視によるLLM可観測性
Grafana Cloud
すぐに使えるダッシュボードとアラートによる簡単なLLM可観測性のためのエージェントレス統合
Honeycomb
OpenTelemetryによる高度なクエリと可視化
クイックスタート
過去7日間の組織の日次使用量を取得:
統合にはUser-Agentヘッダーを設定
統合を構築している場合は、使用パターンを理解するためにUser-Agentヘッダーを設定してください:
使用量API
/v1/organizations/usage_report/messages
エンドポイントを使用して、モデル、ワークスペース、サービスティア別の詳細な内訳で組織全体のトークン消費を追跡します。
主要概念
- 時間バケット: 固定間隔(
1m
、1h
、または1d
)で使用量データを集約 - トークン追跡: キャッシュされていない入力、キャッシュされた入力、キャッシュ作成、出力トークンを測定
- フィルタリングとグループ化: APIキー、ワークスペース、モデル、サービスティア、またはコンテキストウィンドウでフィルタリングし、これらの次元で結果をグループ化
- サーバーツール使用量: ウェブ検索などのサーバーサイドツールの使用量を追跡
完全なパラメータの詳細とレスポンススキーマについては、使用量APIリファレンスを参照してください。
基本的な例
モデル別の日次使用量
フィルタリング付きの時間別使用量
時間粒度の制限
粒度 | デフォルト制限 | 最大制限 | 使用例 |
---|---|---|---|
1m | 60バケット | 1440バケット | リアルタイム監視 |
1h | 24バケット | 168バケット | 日次パターン |
1d | 7バケット | 31バケット | 週次/月次レポート |
コストAPI
/v1/organizations/cost_report
エンドポイントを使用して、USDでのサービスレベルのコスト内訳を取得します。
主要概念
- 通貨: すべてのコストはUSDで、最小単位(セント)の小数文字列として報告
- コストタイプ: トークン使用量、ウェブ検索、コード実行のコストを追跡
- グループ化: 詳細な内訳のためにワークスペースまたは説明でコストをグループ化
- 時間バケット: 日次粒度のみ(
1d
)
完全なパラメータの詳細とレスポンススキーマについては、コストAPIリファレンスを参照してください。
優先ティアのコストは異なる請求モデルを使用しており、コストエンドポイントには含まれていません。代わりに使用量エンドポイントを通じて優先ティアの使用量を追跡してください。
基本的な例
ページネーション
両方のエンドポイントは大きなデータセットのページネーションをサポートしています:
- 最初のリクエストを行う
has_more
がtrue
の場合、次のリクエストでnext_page
の値を使用has_more
がfalse
になるまで続行
一般的な使用例
anthropic-cookbookで詳細な実装を探索:
- 日次使用量レポート: トークン消費トレンドを追跡
- コスト配分: チャージバックのためにワークスペース別に費用を配分
- キャッシュ効率: プロンプトキャッシュを測定・最適化
- 予算監視: 支出しきい値のアラートを設定
- CSV出力: 財務チーム向けレポートを生成
よくある質問
データはどの程度新しいですか?
使用量とコストデータは通常、APIリクエスト完了から5分以内に表示されますが、遅延が長くなることもあります。
推奨されるポーリング頻度は?
APIは持続的な使用のために1分に1回のポーリングをサポートしています。短時間のバースト(例:ページネーションされたデータのダウンロード)では、より頻繁なポーリングも許可されます。頻繁な更新が必要なダッシュボードには結果をキャッシュしてください。
コード実行の使用量を追跡するには?
コード実行のコストは、説明フィールドのCode Execution Usage
の下でグループ化されたコストエンドポイントに表示されます。コード実行は使用量エンドポイントには含まれていません。
優先ティアの使用量を追跡するには?
使用量エンドポイントでservice_tier
でフィルタリングまたはグループ化し、priority
値を探してください。優先ティアのコストはコストエンドポイントでは利用できません。
Workbenchの使用量はどうなりますか?
WorkbenchからのAPI使用量はAPIキーに関連付けられていないため、その次元でグループ化してもapi_key_id
はnull
になります。
デフォルトワークスペースはどのように表現されますか?
デフォルトワークスペースに帰属する使用量とコストは、workspace_id
にnull
値を持ちます。
関連項目
使用量とコストAPIは、ユーザーにより良い体験を提供し、コストを管理し、レート制限を維持するために使用できます。これらの他の機能について詳しく学んでください:
- 管理API概要
- 管理APIリファレンス
- 価格設定
- プロンプトキャッシュ - キャッシュでコストを最適化
- バッチ処理 - バッチリクエストで50%割引
- レート制限 - 使用量ティアを理解