이 가이드는 Claude로 분류기를 구축하기 위한 최상의 접근 방식을 결정하는 프로세스와 사용 사례 탐색부터 백엔드 통합까지 Claude 분류기의 엔드 투 엔드 배포의 핵심 사항을 안내합니다.

Claude를 사용한 분류 구현 예제는 분류 요리책을 참조하세요.

언제 Claude를 분류에 사용해야 할까요

분류 작업에 기존 ML 접근 방식 대신 LLM을 사용하는 것을 고려해야 하는 경우는 언제일까요? 다음은 몇 가지 주요 지표입니다:

  1. 규칙 기반 클래스: Claude는 기본 규칙을 이해할 수 있으므로 클래스가 예제가 아닌 조건으로 정의될 때 사용하세요.
  2. 진화하는 클래스: Claude는 새로운 클래스가 등장하고 경계가 변화하는 새롭거나 변화하는 도메인에 잘 적응합니다.
  3. 비정형 입력: Claude는 다양한 길이의 방대한 양의 비정형 텍스트 입력을 처리할 수 있습니다.
  4. 제한된 레이블 예제: Few-shot 학습 기능으로 Claude는 제한된 레이블 훈련 데이터에서 정확하게 학습합니다.
  5. 추론 요구 사항: Claude는 의미론적 이해, 맥락 및 상위 수준의 추론이 필요한 분류 작업에 탁월합니다.

분류 사용 사례 수립

아래는 Claude가 산업별로 탁월한 일반적인 분류 사용 사례의 비망라적 목록입니다.


분류를 위한 Claude 구현

세 가지 주요 모델 결정 요인은 지능, 지연 시간 및 가격입니다.

분류의 경우 속도와 효율성으로 인해 Claude 3 Haiku와 같은 작은 모델이 일반적으로 이상적입니다. 하지만 전문 지식이나 복잡한 추론이 필요한 분류 작업의 경우 Sonnet 또는 Opus가 더 나은 선택일 수 있습니다. Opus, Sonnet 및 Haiku의 비교에 대해 자세히 알아보려면 여기를 참조하세요.

평가를 사용하여 Claude 모델이 프로덕션에 출시할 만큼 충분히 잘 수행되고 있는지 측정하세요.

1. 강력한 입력 프롬프트 작성

Claude는 기본적으로 높은 수준의 기준 성능을 제공하지만 강력한 입력 프롬프트는 최상의 결과를 얻는 데 도움이 됩니다.

특정 사용 사례에 맞게 조정할 수 있는 일반 분류기의 경우 아래 시작 프롬프트를 복사하세요:

또한 프롬프트 라이브러리에서 다음을 포함한 여러 분류 사용 사례에 대한 프롬프트를 포함하여 시작할 수 있는 다양한 프롬프트를 제공합니다:

감정 분석

트윗 뒤에 숨겨진 어조와 감정 감지. 실시간으로 사용자 감정, 의견 및 반응을 이해합니다.

고객 리뷰 분류

피드백을 미리 지정된 태그로 분류. 제품 통찰력과 고객 서비스 응답을 간소화합니다.

2. 테스트 케이스 개발

분류 평가를 실행하려면 실행할 테스트 케이스가 필요합니다. 테스트 케이스 개발 가이드를 살펴보세요.

3. 평가 실행

평가 지표

분류 작업에서 Claude의 성능을 평가할 때 고려해야 할 몇 가지 성공 지표는 다음과 같습니다:

기준설명
정확도모델의 출력이 정답과 정확히 일치하거나 작업 요구 사항에 따라 입력을 올바르게 분류합니다. 이는 일반적으로 (올바른 예측 수) / (전체 예측 수)로 계산됩니다.
F1 점수모델의 출력이 정밀도와 재현율의 균형을 최적으로 맞춥니다.
일관성모델의 출력이 유사한 입력에 대한 예측과 일치하거나 논리적 패턴을 따릅니다.
구조모델의 출력이 예상 형식이나 구조를 따르므로 구문 분석 및 해석이 쉽습니다. 예를 들어 많은 분류기는 JSON 형식으로 출력할 것으로 예상됩니다.
속도모델이 작업에 허용되는 시간 제한 또는 지연 임계값 내에서 응답을 제공합니다.
편향 및 공정성사람에 대한 데이터를 분류하는 경우 모델이 잘못된 분류로 이어질 수 있는 성별, 민족 또는 기타 특성에 기반한 편견을 보이지 않는 것이 중요합니다.

분류기 배포

Claude를 분류에 사용하는 방법에 대한 코드 예제는 Anthropic Cookbook의 분류 가이드를 참조하세요.