콘텐츠 관리
콘텐츠 관리는 디지털 애플리케이션에서 안전하고 존중되며 생산적인 환경을 유지하는 데 중요한 측면입니다. 이 가이드에서는 Claude를 사용하여 디지털 애플리케이션 내의 콘텐츠를 관리하는 방법을 설명합니다.
콘텐츠 관리 쿡북을 방문하여 Claude를 사용한 콘텐츠 관리 구현 예시를 확인하세요.
Claude로 구축하기 전에
Claude를 콘텐츠 관리에 사용할지 결정하기
다음은 전통적인 ML이나 규칙 기반 접근 방식 대신 Claude와 같은 LLM을 콘텐츠 관리에 사용해야 하는 주요 지표입니다:
관리할 콘텐츠 예시 생성하기
콘텐츠 관리 솔루션을 개발하기 전에 먼저 플래그를 지정해야 할 콘텐츠와 플래그를 지정하지 않아야 할 콘텐츠의 예시를 만드세요. 콘텐츠 관리 시스템이 효과적으로 처리하기 어려울 수 있는 경계 사례와 까다로운 시나리오를 포함해야 합니다. 그런 다음 예시를 검토하여 잘 정의된 관리 카테고리 목록을 만드세요. 예를 들어, 소셜 미디어 플랫폼에서 생성된 예시에는 다음이 포함될 수 있습니다:
이러한 예시를 효과적으로 관리하려면 언어에 대한 미묘한 이해가 필요합니다. ‘이 영화 정말 좋았어요. 주연 배우가 정말 대박이었어요!’라는 댓글에서 콘텐츠 관리 시스템은 “대박”이 은유적 표현이며 실제 폭력의 표시가 아님을 인식해야 합니다. 반대로 명시적인 폭력 언급이 없음에도 불구하고 ‘이 게시물을 지우지 않으면 숨어있어야 할 거예요. 당신과 당신 가족을 찾아갈 거예요.‘라는 댓글은 콘텐츠 관리 시스템에 의해 플래그가 지정되어야 합니다.
unsafe_categories
목록은 특정 요구사항에 맞게 사용자 정의할 수 있습니다. 예를 들어, 웹사이트에서 미성년자가 콘텐츠를 생성하는 것을 방지하려면 목록에 “미성년자 게시”를 추가할 수 있습니다.
Claude를 사용하여 콘텐츠를 관리하는 방법
적절한 Claude 모델 선택하기
모델을 선택할 때는 데이터의 크기를 고려하는 것이 중요합니다. 비용이 문제가 된다면 Claude 3 Haiku와 같은 더 작은 모델이 비용 효율성 때문에 탁월한 선택입니다. 다음은 매월 10억 개의 게시물을 받는 소셜 미디어 플랫폼의 텍스트 관리 비용 추정치입니다:
-
콘텐츠 크기
- 월간 게시물: 10억
- 게시물당 문자: 100
- 총 문자: 1,000억
-
예상 토큰
- 입력 토큰: 286억 (문자당 3.5 토큰 가정)
- 플래그 지정된 메시지 비율: 3%
- 플래그 지정된 메시지당 출력 토큰: 50
- 총 출력 토큰: 15억
-
Claude 3 Haiku 예상 비용
- 입력 토큰 비용: 2,860 MTok * 715
- 출력 토큰 비용: 1,500 MTok * 1,875
- 월간 비용: 1,875 = $2,590
-
Claude 3.5 Sonnet 예상 비용
- 입력 토큰 비용: 2,860 MTok * 8,580
- 출력 토큰 비용: 1,500 MTok * 22,500
- 월간 비용: 22,500 = $31,080
explanation
필드를 제거하면 출력 토큰을 더욱 줄일 수 있습니다.강력한 프롬프트 구축하기
Claude를 콘텐츠 관리에 사용하려면 Claude가 애플리케이션의 관리 요구사항을 이해해야 합니다. 관리 요구사항을 정의할 수 있는 프롬프트를 작성하는 것부터 시작하겠습니다:
이 예시에서 moderate_message
함수는 안전하지 않은 콘텐츠 카테고리와 평가하려는 메시지를 포함하는 평가 프롬프트를 포함합니다. 프롬프트는 Claude에게 정의된 안전하지 않은 카테고리를 기반으로 메시지가 관리되어야 하는지 평가하도록 요청합니다.
그런 다음 모델의 평가를 파싱하여 위반이 있는지 확인합니다. 위반이 있는 경우 Claude는 위반된 카테고리 목록과 메시지가 안전하지 않은 이유에 대한 설명도 반환합니다.
프롬프트 평가하기
콘텐츠 관리는 분류 문제입니다. 따라서 분류 쿡북에 설명된 것과 동일한 기술을 사용하여 콘텐츠 관리 시스템의 정확도를 결정할 수 있습니다.
추가로 고려해야 할 사항은 콘텐츠 관리를 이진 분류 문제로 처리하는 대신 다양한 위험 수준을 나타내는 여러 카테고리를 만들 수 있다는 것입니다. 여러 위험 수준을 만들면 관리의 적극성을 조정할 수 있습니다. 예를 들어, 고위험으로 간주되는 사용자 쿼리를 자동으로 차단하고 중위험 쿼리가 많은 사용자는 인력 검토를 위해 플래그를 지정할 수 있습니다.
이 코드는 Claude를 사용하여 메시지의 위험 수준을 평가하는 assess_risk_level
함수를 구현합니다. 이 함수는 메시지와 안전하지 않은 카테고리 목록을 입력으로 받습니다.
함수 내에서 평가할 메시지, 안전하지 않은 카테고리 및 위험 수준 평가를 위한 특정 지침을 포함하는 프롬프트가 Claude를 위해 생성됩니다. 프롬프트는 Claude에게 위험 수준, 위반된 카테고리 및 선택적 설명을 포함하는 JSON 객체로 응답하도록 지시합니다.
이 접근 방식은 위험 수준을 할당하여 유연한 콘텐츠 관리를 가능하게 합니다. 평가된 위험 수준에 따라 콘텐츠를 자동으로 필터링하거나 인력 검토를 위해 댓글에 플래그를 지정하는 더 큰 시스템에 원활하게 통합될 수 있습니다. 예를 들어, 이 코드를 실행할 때 ‘이 게시물을 지우지 않으면 숨어있어야 할 거예요. 당신과 당신 가족을 찾아갈 거예요.‘라는 댓글은 위험한 위협 때문에 고위험으로 식별됩니다. 반대로 ‘5G 휴대폰을 피하세요!! 5G로 당신을 조종하고 있어요.‘라는 댓글은 중위험으로 분류됩니다.
프롬프트 배포하기
솔루션의 품질에 자신이 생기면 프로덕션에 배포할 시간입니다. 프로덕션에서 콘텐츠 관리를 사용할 때 따라야 할 몇 가지 모범 사례가 있습니다:
-
사용자에게 명확한 피드백 제공: 콘텐츠 관리로 인해 사용자 입력이 차단되거나 응답에 플래그가 지정된 경우, 메시지가 플래그된 이유와 적절하게 다시 작성하는 방법에 대한 정보를 제공하는 유익하고 건설적인 피드백을 제공하세요. 위의 코딩 예시에서는 Claude 응답의
explanation
태그를 통해 이를 수행합니다. -
관리된 콘텐츠 분석: 관리 시스템에 의해 플래그가 지정된 콘텐츠 유형을 추적하여 트렌드와 잠재적인 개선 영역을 식별하세요.
-
지속적인 평가 및 개선: 정밀도와 재현율 추적과 같은 메트릭을 사용하여 콘텐츠 관리 시스템의 성능을 정기적으로 평가하세요. 이 데이터를 사용하여 관리 프롬프트, 키워드 및 평가 기준을 반복적으로 개선하세요.
성능 향상하기
복잡한 시나리오에서는 표준 프롬프트 엔지니어링 기술 이외에 성능을 향상시키기 위한 추가 전략을 고려하는 것이 도움이 될 수 있습니다. 다음은 몇 가지 고급 전략입니다:
주제 정의 및 예시 제공하기
프롬프트에 안전하지 않은 카테고리를 나열하는 것 외에도 각 카테고리에 대한 정의와 관련 구문을 제공하여 추가 개선을 할 수 있습니다.
moderate_message_with_definitions
함수는 이전의 moderate_message
함수를 확장하여 각 안전하지 않은 카테고리를 자세한 정의와 쌍으로 만들 수 있게 합니다. 이는 코드에서 원래 함수의 unsafe_categories
목록을 unsafe_category_definitions
사전으로 대체하여 수행됩니다. 이 사전은 각 안전하지 않은 카테고리를 해당 정의에 매핑합니다. 카테고리 이름과 정의가 모두 프롬프트에 포함됩니다.
주목할 만한 점은 전문적 조언
카테고리에 대한 정의가 이제 금지되어야 하는 재무 조언의 유형을 지정한다는 것입니다. 그 결과, 이전에는 moderate_message
평가를 통과했던 ‘지금이 금에 투자하기 좋은 시기예요!’라는 댓글이 이제는 위반을 트리거합니다.
배치 처리 고려하기
실시간 관리가 필요하지 않은 상황에서 비용을 줄이려면 메시지를 배치로 관리하는 것을 고려하세요. 프롬프트의 컨텍스트에 여러 메시지를 포함하고 Claude에게 어떤 메시지가 관리되어야 하는지 평가하도록 요청하세요.
이 예시에서 batch_moderate_messages
함수는 단일 Claude API 호출로 전체 메시지 배치의 관리를 처리합니다.
함수 내에서 평가할 메시지 목록, 정의된 안전하지 않은 콘텐츠 카테고리 및 해당 설명을 포함하는 프롬프트가 생성됩니다. 프롬프트는 Claude에게 위반이 포함된 모든 메시지를 나열하는 JSON 객체를 반환하도록 지시합니다. 응답의 각 메시지는 입력 목록에서의 위치에 해당하는 id로 식별됩니다.
특정 요구사항에 맞는 최적의 배치 크기를 찾으려면 실험이 필요할 수 있습니다. 더 큰 배치 크기는 비용을 낮출 수 있지만 품질이 약간 저하될 수 있습니다. 또한 더 긴 응답을 수용하기 위해 Claude API 호출의 max_tokens
매개변수를 늘려야 할 수 있습니다. 선택한 모델이 출력할 수 있는 최대 토큰 수에 대한 자세한 내용은 모델 비교 페이지를 참조하세요.