Sistema de moderación de cuatro capas para el espacio más confiable

Asegurar la confianza y la seguridad en los entornos en línea es primordial en la era digital actual. Constantemente desarrollamos sistemas de moderación para garantizar una experiencia de usuario agradable sin ningún problema. Nuestro sistema de moderación contiene cuatro capas y es adecuado para

moderación
tecnología
industria

Publicado el 20 de junio de 2024•5 min de lectura

Sobre el autor

Sistema de moderación de cuatro capas para el espacio más confiable

Consideramos las diferencias entre diversas industrias y establecemos un sistema de moderación que sea adecuado para todos nuestros socios, permitiendo que los usuarios finales se sientan seguros y libres.

Cuatro niveles de moderación

Listas de bloqueo, enmascaramiento de datos sensibles y algunas herramientas adicionales para un área libre de spam

La primera capa de moderación se basa en listas de palabras, frases y enlaces. Es la forma más simple pero efectiva de evitar que los usuarios envíen léxico generalmente violento o nombres de competidores. Para prevenir el spam, puedes restringir el envío de enlaces a un chat. Para evitar compartir datos privados—cualquier número de teléfono—también enmascaramos números de teléfono, cuentas bancarias, coches y números de billeteras de criptomonedas para proteger a los usuarios del fraude.

El beneficio de las listas de bloqueo es que se pueden actualizar en cualquier momento, y agregar nuevos elementos después del lanzamiento es posible. Las listas de detención predeterminadas están preparadas para diferentes idiomas y se activan cuando recibimos el parámetro GET con el idioma de la interfaz de usuario.

Herramientas impulsadas por IA para texto e imágenes

El sistema de moderación de IA verifica todos los mensajes enviados a un chat en 10 ms. Toma automáticamente acciones de moderación predeterminadas cuando detecta contenido que coincide con los criterios establecidos en las reglas, como lenguaje soez, discurso de odio, contenido sexual, autolesiones, política, fraude, etc. La herramienta oculta automáticamente todos los mensajes que coinciden con los criterios, con una marca que indica la razón de la ocultación. Además, la herramienta de IA señala tales mensajes en el panel de administración, permitiendo a los moderadores en vuelo, si es necesario, centrarse en los infractores de las reglas que publicaron estos mensajes o enviar tales problemas al sistema CRM.

Esta herramienta puede ser utilizada para prevenir autolesiones, por ejemplo, en el contexto de apuestas responsables. Si el sistema identifica mensajes que podrían interpretarse como contenido potencial de autolesión, estos mensajes pueden ser enviados al sistema CRM para generar un ticket para resolver el problema, potencialmente bloqueando el acceso a las apuestas. Los chats pueden ser cruciales para las apuestas responsables porque la plataforma principal ve lo que realmente está sucediendo con los usuarios y lo que tienen en mente. La moderación te ayuda a mantener los chats limpios mientras te mantienes en contacto con los usuarios y siempre sabes lo que quieren, dudan, planean y piensan sobre tu plataforma.

Moderación de usuarios

Las personas se han acostumbrado a usar las redes sociales para hacer que su espacio personal sea cómodo y amigable. Los usuarios que ven mensajes ofensivos tienden a reportar dicho contenido, eliminar publicaciones y comentarios inapropiados, y bloquear a sus autores de sus feeds y espacio privado. Por lo tanto, permitimos que los usuarios reporten mensajes e infractores de reglas y los oculten y bloqueen. Los usuarios pueden bloquear a otros usuarios si no se gustan. Ambos pueden continuar comunicándose en un chat, pero no verán los mensajes del otro.

Herramientas para moderación humana en vuelo

Las primeras tres capas cubren el 97% de las violaciones en un chat, pero si necesitas un chat que esté 100% limpio, proporcionamos herramientas convenientes para la moderación en vuelo. Los moderadores pueden ocultar mensajes, marcados por IA, prohibir usuarios y verificar con qué frecuencia ciertos usuarios rompen las reglas. Los moderadores también revisan los informes de los usuarios y transmiten problemas técnicos al sistema CRM, lo que ayuda a los usuarios a sentirse seguros en diferentes niveles.

Todos los niveles son responsables de diferentes beneficios y ventajas

La pre-moderación es fácilmente personalizable. Las plataformas pueden adaptar sus propias reglas para ajustarse a los estándares de la comunidad y sensibilidades culturales, considerando hábitos y posibles violaciones en la plataforma. Las herramientas de IA apoyan la escalabilidad: independientemente del número de usuarios y mensajes recopilados en la plataforma, la IA procesa todo el contenido a la misma velocidad y con la misma alta calidad. La IA ayuda a reducir tareas rutinarias para los moderadores humanos al manejar violaciones del mismo tipo, permitiendo que los moderadores humanos se concentren en tareas más desafiantes o matices. La IA, combinada con la moderación en vuelo, permite una moderación en tiempo real, asegurando que los usuarios no encuentren ninguna violación en el chat, ya que todos los ejemplos de lenguaje soez son capturados por la IA o intervención humana.

Cobertura para todas las sutilezas: las herramientas de moderación de usuarios protegen las preferencias individuales y les ayudan a mantener un buen ánimo. Si alguien apoya a un equipo de fútbol diferente, los usuarios pueden simplemente ocultar a esos aficionados para sí mismos, y todos están contentos.

¿Qué pasa con las reglas del chat?

Tenemos un alcance predeterminado de reglas universales de chat para todos los dominios y plataformas; sin embargo, pueden ser personalizadas para cada plataforma junto con la configuración de las herramientas de IA. Las reglas de chat regulares incluyen las siguientes restricciones:

¿Qué está prohibido?

- Lenguaje obsceno e inapropiado, palabras o frases socialmente inapropiadas/inaceptables, así como abusos, maldiciones y comentarios hostiles

Las maldiciones, el lenguaje vulgar y ofensivo dirigido a denigrar el honor y la dignidad de otros usuarios están todos prohibidos. Por comentarios hostiles, nos referimos a mensajes destinados a ofender a las personas debido a su raza o etnia, nacionalidad, religión, discapacidad o enfermedad, sexo, identidad de género u orientación sexual.

Las declaraciones agresivas o degradantes, los estereotipos dañinos y las declaraciones que se refieren a la inferioridad de otros están prohibidos. Los estereotipos dañinos, que significan comparaciones degradantes, también están prohibidos. El discurso que degrada la dignidad humana a través de comparaciones, generalizaciones o descripciones de comportamiento también está prohibido.

- Inundaciones y anuncios

- Amenazas

- Datos privados

Está prohibido enviar números de teléfono, direcciones, identificaciones, cualquier otro dato de documento, detalles de tarjetas bancarias, etc.—ya sea datos propios de los usuarios o de otros.

- Fraude y mendicidad

- Violaciones de ciberseguridad

Cualquier intento de recopilar información o datos confidenciales de los usuarios o de obtener acceso no autorizado a un servicio, producto o plataforma está prohibido.

- Apodos/nombres de usuario que contengan cualquier cosa restringida por cualquiera de estas reglas están prohibidos. Además, puedes activar una herramienta que verificará los apodos de los usuarios desde los perfiles de la plataforma principal.

- Provocaciones políticas y sexualizadas

La propaganda y cualquier contenido provocativo están prohibidos.

Umbral para violaciones

Todos estos temas y hilos pueden ser configuraciones específicas para las herramientas de IA. El umbral predeterminado para marcar un mensaje como tal es del 75%. Esto significa que si las herramientas de IA están un 75% seguras sobre la existencia de una de las amenazas en un mensaje, será marcado y, si es adecuado, ocultado automáticamente. Sin embargo, si tienes un hilo más sensible para tu plataforma, puedes disminuir el umbral de entrada para tal violación y marcarlo incluso con un 30 o 40% de certeza. Así que, si incluso un indicio de problemas sexuales o autolesiones es inapropiado, agrega el umbral bajo para estos temas, y la IA capturará todas las posibles variaciones e incluso mensajes velados en esta área.

Impulsa tu plataforma con

Herramientas integradas de Watchers para una interacción definitiva

Agenda una llamada Empieza gratis