Moderação de conteúdo
A moderação de conteúdo é um aspecto crítico para manter um ambiente seguro, respeitoso e produtivo em aplicações digitais. Neste guia, discutiremos como o Claude pode ser usado para moderar conteúdo dentro da sua aplicação digital.
Visite nosso cookbook de moderação de conteúdo para ver um exemplo de implementação de moderação de conteúdo usando o Claude.
Antes de construir com o Claude
Decida se deve usar o Claude para moderação de conteúdo
Aqui estão alguns indicadores-chave de que você deve usar um LLM como o Claude em vez de uma abordagem tradicional de ML ou baseada em regras para moderação de conteúdo:
Gere exemplos de conteúdo para moderar
Antes de desenvolver uma solução de moderação de conteúdo, primeiro crie exemplos de conteúdo que deve ser sinalizado e conteúdo que não deve ser sinalizado. Certifique-se de incluir casos extremos e cenários desafiadores que podem ser difíceis para um sistema de moderação de conteúdo lidar efetivamente. Depois, revise seus exemplos para criar uma lista bem definida de categorias de moderação. Por exemplo, os exemplos gerados por uma plataforma de mídia social podem incluir o seguinte:
Moderar efetivamente esses exemplos requer uma compreensão nuançada da linguagem. No comentário Este filme foi ótimo, eu realmente gostei. O ator principal arrasou!
, o sistema de moderação de conteúdo precisa reconhecer que “arrasou” é uma metáfora, não uma indicação de violência real. Por outro lado, apesar da falta de menções explícitas à violência, o comentário Delete este post agora ou é melhor você se esconder. Estou indo atrás de você e sua família.
deve ser sinalizado pelo sistema de moderação de conteúdo.
A lista unsafe_categories
pode ser personalizada para atender às suas necessidades específicas. Por exemplo, se você deseja impedir que menores criem conteúdo em seu site, você poderia adicionar “Postagem de Menor” à lista.
Como moderar conteúdo usando o Claude
Selecione o modelo Claude correto
Ao selecionar um modelo, é importante considerar o tamanho dos seus dados. Se os custos são uma preocupação, um modelo menor como o Claude 3 Haiku é uma excelente escolha devido à sua relação custo-benefício. Abaixo está uma estimativa do custo para moderar texto para uma plataforma de mídia social que recebe um bilhão de posts por mês:
-
Tamanho do conteúdo
- Posts por mês: 1bn
- Caracteres por post: 100
- Total de caracteres: 100bn
-
Tokens estimados
- Tokens de entrada: 28,6bn (assumindo 1 token por 3,5 caracteres)
- Porcentagem de mensagens sinalizadas: 3%
- Tokens de saída por mensagem sinalizada: 50
- Total de tokens de saída: 1,5bn
-
Custo estimado do Claude 3 Haiku
- Custo de tokens de entrada: 2.860 MTok * $0,25/MTok = $715
- Custo de tokens de saída: 1.500 MTok * $1,25/MTok = $1.875
- Custo mensal: $715 + $1.875 = $2.590
-
Custo estimado do Claude 3.5 Sonnet
- Custo de tokens de entrada: 2.860 MTok * $3,00/MTok = $8.580
- Custo de tokens de saída: 1.500 MTok * $15,00/MTok = $22.500
- Custo mensal: $8.580 + $22.500 = $31.080
explanation
da resposta.Construa um prompt forte
Para usar o Claude para moderação de conteúdo, o Claude deve entender os requisitos de moderação da sua aplicação. Vamos começar escrevendo um prompt que permite definir suas necessidades de moderação:
[Continua na próxima parte devido ao limite de caracteres…]
Was this page helpful?