Nuevo modelo más preciso de IA detecta mensajes de odio en español en las redes sociales
Investigadores de la UEx han desarrollado SHS-ALBETO, un sistema basado en Inteligencia Artificial que mejora la detección automática de mensajes de odio en redes sociales
ENTREVISTA CON JESÚS MANUEL SÁNCHEZ - SHS-ALBETO UEX
Radio Extremadura
La proliferación online de mensajes ofensivos y discursos de odio supone un desafío urgente. Aunque las plataformas intentan frenarlo, sigue siendo difícil detectar estos mensajes automáticamente, especialmente en idiomas distintos del inglés, como el español. Es por ello que investigadores de la Escuela Politécnica de la Universidad de Extremadura han desarrollado SHS-ALBETO, Spanish Hate Speech detection with ALBETO, modelo basado en la arquitectura BERT, entrenado exclusivamente en español.
Se trata de un modelo de aprendizaje profundo o deep learning basado en Transformers, una tecnología avanzada de procesamiento del lenguaje natural basada en redes neuronales diseñadas para entender el contexto de las palabras en un texto mediante un mecanismo de auto-atención o self-attention. Esta técnica permite que el sistema analice cada palabra de un texto considerando su relación con todas las demás palabras de la frase y, además, mejora la comprensión del contexto, esencial para detectar ironía, sarcasmo o lenguaje ambiguo.
Los investigadores de la UEx han entrenado y ajustado SHS-ALBETO con datos reales de la red social X, para ver si podía mejorar la detección de mensajes de odio frente a otras soluciones existentes. También buscábamos comparar su desempeño con modelos previos basados en la arquitectura BERT, como BETO o DistilBETO, evaluando si su enfoque lograba resultados superiores.
Jesús Manuel Sánchez, investigador en el proyecto de la UEx, pasaba por los micrófonos de La Ser para contarnos los detalles de este modelo SHS-ALBETO que ya ha logrado resultados muy destacados.
Este nuevo sistema detectó más mensajes de odio en redes correctamente en español y con menos errores que las soluciones anteriores, estableciendo un nuevo referente en la detección de odio en español. En el conjunto de prueba, obtuvo una puntuación F1 cercana a 0.78, claramente superior a la de cualquier modelo previo. Y desde una comparativa de tipo cuantitativo, los investigadores de la UEx destacan que SHS-ALBETO mejoró en torno a un 10% las métricas clave de precisión, sensibilidad y exactitud frente a modelos competidores como BERT multilingüe o BETO.
La herramienta SHS-ALBETO puede ayudar a redes sociales y comunidades online a eliminar o moderar contenidos ofensivos o de odio rápidamente, impidiendo que alcance a más usuarios o se vuelva viral.