Por Sara Leos (@SaraLeosA) /ZonaDocs
7 de junio de 2019.- “Puta, pendeja, estúpida, zorra, culera, cabrona, huevona, vieja, pinche y boluda” son las palabras que resultaron detectadas en el código realizado como parte de investigación titulada: “Detección de agresiones electrónicas en redes sociales mediante minería de texto. El caso de ataques contra mujeres en Facebook”, elaborada por la maestra en Tecnologías de la Información de la Universidad de Guadalajara, Alejandra Pedroza Marchena.
“Las agresiones verbales también encuentran otros canales como son las plataformas en internet (…) el método que yo desarrollé es un algoritmo o un código que ya sabe cuáles son las majaderías, y las agresiones contra mujeres, aunque es necesario meterle un texto para someterlo al análisis”, precisó Alejandra Pedroza.
El anonimato, y “el hecho de que no hay límite de espacios-temporales, también facilita las agresiones verbales en internet”, apuntó; por ello, la motivación de Alejandra Pedroza por realizar el algoritmo o código para analizar las agresiones contra la mujer en redes sociales, nació por el contexto de violencia que viven las mujeres en el mundo.
Otro de los motivos es porque ella misma ha padecido esta violencia de género: “lo he vivido, porque todos los días lo padezco, incluso, en la familia, de algún modo hay agresiones, hay agresiones pasivas, pero también activas, en las que a través del lenguaje se me estigmatiza o se me hace menos y cuando me pongo a pensar cuál es la razón, nada más es porque nací mujer”.
La metodología utilizada para crear el algoritmo
La investigadora Alejandra Pedroza Marchena contó que de entrada quería hacer algo sobre análisis de datos de manera automatizada porque siempre le han interesado mucho los temas de género”, pero también porque ha vivido agresiones: “entiendo como ocurre, sobre todo lo viví en la maestría que era un ambiente de muchos ingenieros hombres”.
Por tal razón optó por utilizar en su metodología el Análisis de Textos o mejor dicho la Minería de Textos, la cual se utiliza para detectar agresiones verbales en general; algunos ejemplos de su uso giran alrededor del bullying, y para identificar agresiones entre quienes juegan videojuegos (gamers) on line.
La investigadora señala que el foco de su investigación es la detección de la violencia de género en redes sociales: “Voy a aplicarlo para poder detectar un tipo de violencia contra la mujer que ocurre desde las palabras y que se propaga en los sitios como Facebook”.
Dentro de la Minería de Texto, precisa Alejandra Pedroza, “hay una corriente que se llama Análisis de sentimientos y ésta lo que hace es detectar, pues justamente sentimientos o polaridades, en un texto o en palabras (…) Puede “detectar si el comentario es negativo o si es positivo, o neutro, o puede detectar si hay enojo, alegría o miedo”, añadió.
Agregó que el “Análisis de Sentimientos”, por ejemplo, ha sido utilizado para obtener la percepción de candidatos políticos o de algún producto, “las empresas los usan para saber lo que la gente está opinando”.
Facebook, Instagram, WhatsApp, Pinterest, Twitter y Snapchat son las redes sociales donde el “Análisis de Sentimiento” se podría utilizar para identificar agresiones a las mujeres.
La manera en que realizó el análisis fue a través de Machine Learning que es el aprendizaje automatizado de las computadoras, es decir, creó sistemas que aprenden de manera automática: “entrenamiento a la máquina tal cual, tú le dices a un programa o algún algoritmo, mira, estas palabras son positivas, estas son negativas, estas son miedo y estas son felicidad, entonces, el algoritmo ya sabe eso, y después le metes más mensajes, más palabras, más texto y lo que hace el algoritmo, como ya sabe qué detectar: categoriza las palabras”.
Para lograr este análisis tuvo que recurrir a los mensajes que los usuarios colocaban o colgaban en los portales de Facebook de los medios: CNN en Español (Internacional), Aristegui Noticias (Nacional) y Tráfico ZMG (Local), esto durante los días previos o posteriores al Día Internacional de la Mujer (8 de marzo) y en notas alusivas a la misma conmemoración; en total, la investigadora, sumó casi 4 mil mensajes.
“Entonces yo le dije a al algoritmo, mira, estas palabras son majaderías y estas palabras son agresiones contra mujeres”, así como Alejandra Pedroza narra cómo es que comenzó su análisis, lo cual la llevó a un inventario de majaderías mexicanas, y un inventario de majaderías latinoamericanas que también incluyo en el algoritmo.