Moderación de contenido
La moderación de contenido es un aspecto crítico para mantener un entorno seguro, respetuoso y productivo en las aplicaciones digitales. En esta guía, discutiremos cómo se puede utilizar Claude para moderar contenido dentro de su aplicación digital.
Visite nuestro libro de recetas de moderación de contenido para ver un ejemplo de implementación de moderación de contenido usando Claude.
Antes de construir con Claude
Decida si usar Claude para la moderación de contenido
Aquí hay algunos indicadores clave de que debería usar un LLM como Claude en lugar de un enfoque tradicional de ML o basado en reglas para la moderación de contenido:
Genere ejemplos de contenido para moderar
Antes de desarrollar una solución de moderación de contenido, primero cree ejemplos de contenido que debería ser marcado y contenido que no debería ser marcado. Asegúrese de incluir casos límite y escenarios desafiantes que pueden ser difíciles de manejar efectivamente para un sistema de moderación de contenido. Después, revise sus ejemplos para crear una lista bien definida de categorías de moderación. Por ejemplo, los ejemplos generados por una plataforma de redes sociales podrían incluir lo siguiente:
Moderar efectivamente estos ejemplos requiere una comprensión matizada del lenguaje. En el comentario, Esta película fue genial, realmente la disfruté. ¡El actor principal la rompió!
, el sistema de moderación de contenido necesita reconocer que “la rompió” es una metáfora, no una indicación de violencia real. Por el contrario, a pesar de la falta de menciones explícitas de violencia, el comentario Borra esta publicación ahora o mejor escóndete. Voy por ti y tu familia.
debería ser marcado por el sistema de moderación de contenido.
La lista unsafe_categories
puede ser personalizada para adaptarse a sus necesidades específicas. Por ejemplo, si desea evitar que los menores creen contenido en su sitio web, podría agregar “Publicación de Menores” a la lista.
Cómo moderar contenido usando Claude
Seleccione el modelo Claude correcto
Al seleccionar un modelo, es importante considerar el tamaño de sus datos. Si los costos son una preocupación, un modelo más pequeño como Claude 3 Haiku es una excelente opción debido a su rentabilidad. A continuación se muestra una estimación del costo para moderar texto para una plataforma de redes sociales que recibe mil millones de publicaciones por mes:
-
Tamaño del contenido
- Publicaciones por mes: 1bn
- Caracteres por publicación: 100
- Total de caracteres: 100bn
-
Tokens estimados
- Tokens de entrada: 28.6bn (asumiendo 1 token por 3.5 caracteres)
- Porcentaje de mensajes marcados: 3%
- Tokens de salida por mensaje marcado: 50
- Total de tokens de salida: 1.5bn
-
Costo estimado de Claude 3 Haiku
- Costo de tokens de entrada: 2,860 MTok * $0.25/MTok = $715
- Costo de tokens de salida: 1,500 MTok * $1.25/MTok = $1,875
- Costo mensual: $715 + $1,875 = $2,590
-
Costo estimado de Claude 3.5 Sonnet
- Costo de tokens de entrada: 2,860 MTok * $3.00/MTok = $8,580
- Costo de tokens de salida: 1,500 MTok * $15.00/MTok = $22,500
- Costo mensual: $8,580 + $22,500 = $31,080
explanation
de la respuesta.Construya un prompt sólido
Para usar Claude para la moderación de contenido, Claude debe entender los requisitos de moderación de su aplicación. Comencemos escribiendo un prompt que le permita definir sus necesidades de moderación:
[Continúa en la siguiente parte debido al límite de caracteres…]
Was this page helpful?