Infraestructura para análisis de Big Data
Boletín de prensa
1437/2015
Aguascalientes, Aguascalientes. 18 de noviembre de 2015 (Agencia Informativa Conacyt).- El investigador Juan Carlos García, director de la carrera de Ingeniería en Inteligencia Artificial de la Universidad Panamericana (UP), campus Bonaterra, en Aguascalientes, desarrolla un proyecto que permitirá la gestión y almacenamiento de grandes cantidades de información digital (Big Data), con el objetivo de generar nuevas conclusiones a partir de su análisis.
El proyecto consiste en validar distintos escenarios de implementación como infraestructura y arquitectura de cómputo distribuido y supercómputo en la nube de Internet, implementando motores y bases de datos. “Localizar la infraestructura necesaria para un proyecto de datos masivos, trabajar el modelo matemático para la predicción, uso y dar sentido a los datos para posteriormente aplicar el modelo matemático, es lo que nosotros estamos desarrollando”, explicó el investigador en entrevista para la Agencia Informativa Conacyt.
Expuso que trabaja con cuatro tecnologías que permiten montar distintos motores de almacenamiento de datos no relacionales, mencionó que utiliza las plataformas de Microsoft, IBM, Amazon y recursos propios de computación de alto rendimiento (HPC por las siglas en inglés de High Performance Computing), herramienta muy importante en el desarrollo de simulaciones computacionales a problemas complejos, acotó que en estos recursos evalúan las bases de datos de Spark, Hadopp y Oracle NoSQL.
En relación con una investigación que se ha insertado en este sistema, indicó, se tiene 65 por ciento de avance de integración de información filtrada a dos bases de datos, Oracle NoSQL y Apache de IBM, en el tema para detectar cuáles son los índices de deserción universitaria a partir de distintas situaciones, acotó que se tienen más de mil 500 variables contempladas como factores que pueden afectar.
LV/AT/FV/1437/2015