LLMゲートウェイは、Claude Codeとモデルプロバイダー間の集中プロキシレイヤーを提供し、以下を実現します:

  • 集中認証 - APIキー管理の単一ポイント
  • 使用量追跡 - チームやプロジェクト全体での使用量監視
  • コスト制御 - 予算とレート制限の実装
  • 監査ログ - コンプライアンスのためのすべてのモデルインタラクションの追跡
  • モデルルーティング - コード変更なしでプロバイダー間の切り替え

LiteLLM設定

LiteLLMはサードパーティのプロキシサービスです。AnthropicはLiteLLMのセキュリティや機能性を推奨、維持、監査していません。このガイドは情報提供目的で提供されており、古くなる可能性があります。自己責任でご使用ください。

前提条件

  • Claude Codeが最新バージョンに更新されていること
  • LiteLLM Proxy Serverがデプロイされ、アクセス可能であること
  • 選択したプロバイダーを通じてClaudeモデルへのアクセス

基本的なLiteLLMセットアップ

Claude Codeの設定

認証方法

静的APIキー

固定APIキーを使用する最もシンプルな方法:

# 環境で設定
export ANTHROPIC_AUTH_TOKEN=sk-litellm-static-key

# またはClaude Code設定で
{
  "env": {
    "ANTHROPIC_AUTH_TOKEN": "sk-litellm-static-key"
  }
}

この値はAuthorizationProxy-Authorizationヘッダーとして送信されますが、Authorizationは上書きされる可能性があります(下記のVertex「クライアント指定認証情報」を参照)。

ヘルパーを使用した動的APIキー

キーのローテーションやユーザーごとの認証の場合:

  1. APIキーヘルパースクリプトを作成:
#!/bin/bash
# ~/bin/get-litellm-key.sh

# 例:vaultからキーを取得
vault kv get -field=api_key secret/litellm/claude-code

# 例:JWTトークンを生成
jwt encode \
  --secret="${JWT_SECRET}" \
  --exp="+1h" \
  '{"user":"'${USER}'","team":"engineering"}'
  1. ヘルパーを使用するようにClaude Code設定を構成:
{
  "apiKeyHelper": "~/bin/get-litellm-key.sh"
}
  1. トークン更新間隔を設定:
# 1時間ごとに更新(3600000 ms)
export CLAUDE_CODE_API_KEY_HELPER_TTL_MS=3600000

この値はAuthorizationProxy-AuthorizationX-Api-Keyヘッダーとして送信されますが、Authorizationは上書きされる可能性があります(Google Vertex AI through LiteLLMを参照)。apiKeyHelperANTHROPIC_AUTH_TOKENANTHROPIC_API_KEYよりも優先度が低くなります。

プロバイダー固有の設定

LiteLLMを通じたAnthropic API

パススルーエンドポイントを使用:

export ANTHROPIC_BASE_URL=https://litellm-server:4000/anthropic
LiteLLMを通じたAmazon Bedrock

パススルーエンドポイントを使用:

export ANTHROPIC_BEDROCK_BASE_URL=https://litellm-server:4000/bedrock
export CLAUDE_CODE_SKIP_BEDROCK_AUTH=1
export CLAUDE_CODE_USE_BEDROCK=1
LiteLLMを通じたGoogle Vertex AI

パススルーエンドポイントを使用:

推奨:プロキシ指定認証情報

export ANTHROPIC_VERTEX_BASE_URL=https://litellm-server:4000/vertex_ai/v1
export ANTHROPIC_VERTEX_PROJECT_ID=your-gcp-project-id
export CLAUDE_CODE_SKIP_VERTEX_AUTH=1
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=us-east5

代替:クライアント指定認証情報

ローカルGCP認証情報を使用したい場合:

  1. ローカルでGCPに認証:
gcloud auth application-default login
  1. Claude Code環境を設定:
export ANTHROPIC_VERTEX_BASE_URL=https://litellm-server:4000/vertex_ai/v1
export ANTHROPIC_VERTEX_PROJECT_ID=your-gcp-project-id
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=us-east5
  1. LiteLLMヘッダー設定を更新:

パススルーGCPトークンがAuthorizationヘッダーに配置されるため、LiteLLM設定でgeneral_settings.litellm_key_header_nameProxy-Authorizationに設定されていることを確認してください。

統一エンドポイント

LiteLLMのAnthropic形式エンドポイントを使用:

export ANTHROPIC_BASE_URL=https://litellm-server:4000

モデル選択

デフォルトでは、モデルはモデル設定で指定されたものを使用します。

LiteLLMでカスタムモデル名を設定している場合は、前述の環境変数をそれらのカスタム名に設定してください。

詳細については、LiteLLMドキュメントを参照してください。

追加リソース