Dos centros Conacyt desarrollaron la inteligencia computacional del “ánimo de los tuiteros en México”
Centro de Investigación e Innovación en
Tecnologías de la Información y Comunicación
Comunicado
Ciudad de México, a 23 de enero 2018
- ¿Sabías que Infotec y CentroGeo desarrollaron la herramienta tecnológica para que la medición del estado de ánimo de los tuiteros en México fuera posible?
Recientemente, el Inegi presentó la herramienta “estado de ánimo de los tuiteros en México”. Única en el mundo, esta herramienta representa el ejercicio de generación de información estadística con más alta frecuencia del Inegi. Se trata de un trabajo experimental que analiza los sentimientos de los tuiteros en México con el objetivo de interpretar la emotividad que subyace en los mensajes que se publican en la plataforma digital Twitter.
En el desarrollo de los modelos computacionales participaron investigadores de cátedras Conacyt asignados a los laboratorios de Analítica Computacional de Infotec y al de Geointeligencia del CentroGeo, así como otros investigadores de ambos centros de investigación.
Su participación en el desarrollo de la herramienta se centra en la creación de modelos de texto robustos a diferentes tipos de errores y variantes morfológicas y léxicas que se encuentran de manera común en redes sociales como Twitter, estos incluyen errores ortográficos, léxicos, anglicismos, hashtags, emoticones, etcétera. Los investigadores también aportaron en la creación de clasificadores especializados para la tarea análisis de sentimientos, basados en los modelos de texto mencionados. Algunos aspectos específicos de la participación de los investigadores de Infotec y CentroGeo se mencionan en el documento metodológico de la segunda edición del ánimo tuitero del Inegi.
Los algoritmos desarrollados, además de ser robustos a errores y variantes presentes en los escritos informales de redes sociales, funcionan para varios lenguajes. Los resultados se han mostrado competitivos cuando se han comparado incluso con técnicas diseñadas exprofeso para lenguajes distintos al español.
En la actualidad, los investigadores están trabajando para extender sus algoritmos a otras tareas, como la detección de enojo, alegría, gozo o tristeza en un texto corto, y dar soporte explícito a algunas formas del lenguaje figurado, como el irónico y el sarcástico; esta es una tarea compleja que supone un entendimiento más profundo del texto y su significado.
Los servicios analíticos relacionados con estas investigaciones ya son aprovechados por otros desarrollos tecnológicos como el AGEI (Autómata GeoInteligente de Internet) que desarrolla el Laboratorio Nacional de Geointeligencia del CentroGeo. Adicionalmente, Infotec se encuentra en el proceso de añadir otras capacidades analíticas basadas en inteligencia computacional, en muchos de sus servicios de información. La meta es que la investigación aplicada de los centros públicos de investigación sea benéfica para la sociedad.
Otras actividades en las que el grupo de investigadores está trabajando es en las tareas de clasificación que involucran texto, como identificación de autores, perfil de usuarios y detección de tópicos en documentos de diversos orígenes. Este tipo de tareas pueden usarse para explotar la información de grandes volúmenes de datos; la idea general es que los algoritmos sean capaces de segmentar los datos de manera coherente y obtener estadísticas a granularidades más finas.
La investigación generada por los investigadores sobre el estado de ánimo de los tuiteros en México se ha publicado en revistas científicas de prestigio en el área de aprendizaje computacional y ha sido presentada en foros internacionales especializados.
Para conocer más sobre las herramientas y el trabajo de investigación consulte la página: http://www.ingeotec.mx/
Datos de contacto:
Tere Soria
Comunicación, Infotec
Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.
tel. 55-56242800 ext. 3048