LLM 게이트웨이 구성
LiteLLM 설정, 인증 방법, 사용량 추적 및 예산 관리와 같은 엔터프라이즈 기능을 포함하여 LLM 게이트웨이 솔루션으로 Claude Code를 구성하는 방법을 알아보세요.
LLM 게이트웨이는 Claude Code와 모델 제공업체 간의 중앙 집중식 프록시 계층을 제공하며, 다음과 같은 기능을 제공합니다:
- 중앙 집중식 인증 - API 키 관리를 위한 단일 지점
- 사용량 추적 - 팀과 프로젝트 전반의 사용량 모니터링
- 비용 제어 - 예산 및 속도 제한 구현
- 감사 로깅 - 규정 준수를 위한 모든 모델 상호작용 추적
- 모델 라우팅 - 코드 변경 없이 제공업체 간 전환
LiteLLM 구성
LiteLLM은 타사 프록시 서비스입니다. Anthropic은 LiteLLM의 보안이나 기능을 보증, 유지관리 또는 감사하지 않습니다. 이 가이드는 정보 제공 목적으로만 제공되며 시간이 지나면서 구식이 될 수 있습니다. 본인의 판단하에 사용하세요.
전제 조건
- 최신 버전으로 업데이트된 Claude Code
- 배포되고 접근 가능한 LiteLLM Proxy Server
- 선택한 제공업체를 통한 Claude 모델에 대한 액세스
기본 LiteLLM 설정
Claude Code 구성:
인증 방법
정적 API 키
고정 API 키를 사용하는 가장 간단한 방법:
이 값은 Authorization
및 Proxy-Authorization
헤더로 전송되지만, Authorization
은 덮어쓰여질 수 있습니다(아래 Vertex “클라이언트 지정 자격 증명” 참조).
헬퍼를 사용한 동적 API 키
키 순환 또는 사용자별 인증의 경우:
- API 키 헬퍼 스크립트 생성:
- 헬퍼를 사용하도록 Claude Code 설정 구성:
- 토큰 새로고침 간격 설정:
이 값은 Authorization
, Proxy-Authorization
, X-Api-Key
헤더로 전송되지만, Authorization
은 덮어쓰여질 수 있습니다(LiteLLM을 통한 Google Vertex AI 참조). apiKeyHelper
는 ANTHROPIC_AUTH_TOKEN
또는 ANTHROPIC_API_KEY
보다 낮은 우선순위를 가집니다.
제공업체별 구성
LiteLLM을 통한 Anthropic API
패스스루 엔드포인트 사용:
LiteLLM을 통한 Amazon Bedrock
패스스루 엔드포인트 사용:
LiteLLM을 통한 Google Vertex AI
패스스루 엔드포인트 사용:
권장: 프록시 지정 자격 증명
대안: 클라이언트 지정 자격 증명
로컬 GCP 자격 증명을 사용하려는 경우:
- 로컬에서 GCP로 인증:
- Claude Code 환경 설정:
- LiteLLM 헤더 구성 업데이트:
패스스루 GCP 토큰이 Authorization
헤더에 위치하므로 LiteLLM 구성에서 general_settings.litellm_key_header_name
이 Proxy-Authorization
으로 설정되어 있는지 확인하세요.
통합 엔드포인트
LiteLLM의 Anthropic 형식 엔드포인트 사용:
모델 선택
기본적으로 모델은 모델 구성에서 지정된 모델을 사용합니다.
LiteLLM에서 사용자 정의 모델 이름을 구성한 경우, 앞서 언급한 환경 변수를 해당 사용자 정의 이름으로 설정하세요.
더 자세한 정보는 LiteLLM 문서를 참조하세요.