BIG DATA y la seguridad en tu vida cotidiana
Por Salim Sigales
¿Sabías que… el término Big Data se utilizó por vez primera en 1997 en un artículo publicado por investigadores de la NASA?
El mundo está en constante cambio, las tecnologías avanzan y aumenta de forma exponencial los datos que soportan, lo que representa un desafío para su correcta gestión, análisis y almacenamiento.
Siendo esto último un reto que llevaría a los investigadores de la NASA Michael Cox y David Ellsworth a utilizar por primera vez el término “El problema de la Big Data” en su artículo “Application-Controlled Demand Paging for Out-of-Core Visualization”.
Dicho término es utilizado para describir un gran volumen de datos almacenados en un repositorio que tienen una estructura compleja y los cuales pueden ser procesados en tiempos razonables para ayudarnos a resolver problemas logísticos, sociales, de infraestructura, así como responder a preguntas complejas para tomar decisiones más asertivas a costos atractivos para las empresas. La estructura de los datos que alimenta Big Data se divide en los siguientes tipos:
- Estructurados: Estos son archivos de texto ordenados en filas y columnas. Por ejemplos las bases de datos.
- No estructurados: Son fáciles de identificar por ejemplo los videos, audios o documentos.
- Semiestructurados: Dentro de este tipo se encuentran los correos electrónicos que pueden proveer de información relevante sin embargo no tienen una estructura como tal.
Un mundo de información
Como es evidente, en la actualidad se generan enormes cantidades de datos que se desbordan a un ritmo acelerado día a día, los cuales alimentan a Big Data y provienen de diferentes fuentes, principalmente de redes sociales al ser de acceso fácil y público.
Las cinco dimensiones que conforman dicho término son conocidas como las 5 V’s del Big Data. A continuación podrás entender fácilmente cada uno de ellos.
- Volumen: Son las grandes cantidades de información que deben ser procesadas por tecnologías especiales.
- Variabilidad: Se refiere a que los datos provienen de diferentes fuentes de información como lo son un Call Center, un hospital, redes sociales o movimientos bancarios entre otros.
- Velocidad: Esto es cuando hablamos de que se está generando información en todo momento. Por lo tanto siempre está en constante crecimiento el volumen de la misma.
- Veracidad: Es cuando hablamos de datos que no han sido manipulados intencionalmente. En caso contrario, no nos ayudaría a elaborar un verdadero análisis.
- Valor: Este es el considerado más importante, ya que nos ayudará a identificar si esta información nos será útil para la toma de decisiones.
Toda tu vida en datos
¿Cómo influye Big Data en la vida cotidiana? Para entenderlo de una manera práctica vamos a comparar la vida de tus abuelos con relación a la tuya. Por ejemplo ¿Sabes cuál era la comida favorita de tus abuelos? O algo más complejo ¿Sabes cuáles temas eran sus favoritos? Con las tecnologías actuales no sería difícil saberlo.
Si tienes un teléfono inteligente y eres suscriptor de redes sociales como Facebook, Instagram, Twitter, Whatsapp, Linkedin, Youtube, cuenta de correo y navegas en la web, debes saber que ya eres parte de una gran red y alguien en este mundo está recabando millones de datos incluyendo los tuyos a través de software Big Data para fines comerciales, con lo que se pueden entender tus comportamientos de consumo para así persuadirte a comprar productos específicos.
Ese constante bombardeo de anuncios publicitarios en tus redes sociales se deriva del uso de Big Data para el marketing y ventas, donde se utilizan los datos que permiten conocer, analizar y pronosticar los hábitos de consumo de los clientes.
BIG DATA y ciencia
También la ciencia se ve beneficiada, por ejemplo el Gran Colisionador de Hadrones genera tanta información que sin la existencia de Big Data no sería posible continuar investigando los secretos del universo.
Por otro lado las ciudades se pueden beneficiar con estas tecnologías permitiendo optimizar los flujos de tráfico a través de la recepción de datos recibidos en tiempo real, lo cual puede ayudar a que los semáforos trabajen de tal manera que eviten los famosos embotellamientos.
Y los deportes no son ajenos a Big Data ya que estos también se ven beneficiados a través del uso de dispositivos inteligentes de monitoreo que proporcionan información valiosa sobre la nutrición, preparación física e incluso el estado emocional de un deportista con base a sus interacciones en redes sociales.
Big Data también tiene importantes aplicaciones en seguridad y defensa, como son:
- Ciberdefensa / Ciberseguridad
- Lucha contra el fraude
- Protección de redes
- Seguridad Ciudadana
- Seguridad física de infraestructuras críticas.
- Control y comportamientos de multitudes
- Vigilancia y Seguridad en fronteras
- Inteligencia Militar
- Lucha contra el terrorismo y crimen organizado
- Planeación táctica de misiones
- Toma de decisión en tiempo real para operaciones (Defensa/seguridad).
- Seguridad espacial
BIG DATA actualmente es utilizado para cubrir las necesidades de los 5 ámbitos en defensa que son:
- Para seguridad y defensa en Mar
- Para seguridad y defensa en Tierra
- Para seguridad y defensa en Aire
- Para seguridad y defensa del Ciberespacio
- Para seguridad y defensa del Espacio
Actualmente existen sistemas de inteligencia artificiales como el mencionado en el artículo “Training a big data machine to defend”, que es un sistema de seguridad diseñado por investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) del MIT. que tiene por objetivo procesar grandes cantidades de datos, y con el uso del aprendizaje automático, crear más patrones y con ello hacer predicciones, siendo esto último lo que ayuda a resaltar la actividad sospechosa que es una característica típica de los ciberataques.
Dicho sistema de seguridad es alimentado por especialistas para mejorar la detección y precisión ante la evolución de los ciberataques. En resumen este sistema es como si un policía cibernético en tu computadora estuviera pendiente de la actividad, con la capacidad de identificar cuándo sucede algo sospechoso, como cuando un ladrón quiere entrar a una zona restringida en la vida real.
Como puedes ver este sistema de Big Data ofrece beneficios en tiempos de solución a problemas, así como reduce los costos operativos, ya que con el aumento de información a analizar no requiere la contratación de más recursos humanos, basta contar con los necesarios, lo cual se traduce en una solución atractiva para las empresas.
El Big Data también tiene importantes aplicaciones realizar tareas de inteligencia y en combate el crimen, por ejemplo lo realizado en los Estados Unidos que daría origen a ICREACH, que es un programa creado por la Agencia de Seguridad Nacional con la finalidad de poder compartir metadatos. Los cuales son un conjunto de datos que describen el contenido informativo de un recurso por ejemplo, el metadato podría documentar atributos como el (nombre, tamaño, tipo de dato, etc), de recursos como los archivos de correo o mensajes de texto entre otros.
ICREACH fue desarrollado con la intención de facilitar el acceso a los metadatos entre una comunidad de inteligencia conformada por la Agencia Central de Inteligencia, el Buró Federal de Investigaciones, la Agencia de Inteligencia de Defensa, el mando de estrategia de los Estados Unidos y la Administración para el control de Drogas. Dicha herramienta tiene por objetivo dar acceso a datos relacionados de telefonía y eventualmente a información de Inteligencia de Red Digital.
Por ejemplo sabemos que la información compartida incluía identificadores como lo son el origen, destinatario, fecha, tiempo, duración de la transacción y en algunos casos la localización de los objetivos. Y todo ello podía ser consultado a través de una interfaz gráfica.
Es momento de responder a ¿cuáles investigaciones o aplicaciones de Big Data se hacen actualmente en seguridad?
La empresa INDRA es una gran referente en el desarrollo tecnológico para seguridad y defensa. Como lo es el proyecto de innovación Transforming Transport el cual es liderado por dicha empresa y el cual utiliza Big Data para mejorar la movilidad en Europa ya que permite definir modelos de comportamiento de los pasajeros en las terminales, ayudando a predecir sus tiempos de llegada, sus movimientos y necesidades.
Pero si lo encaminamos en términos de seguridad el modelo de Estación Inteligente se adapta a las peculiaridades de cada terminal. El modelo de estación inteligente también facilita la identificación de personas potencialmente sospechosas o de situaciones peligrosas mediante la escucha activa en redes sociales.
Durante la siguiente mitad de 2019 y durante el 2020 se pronostica que Big Data evolucionará para ofrecer mayores ventajas en el sector deportivo, transporte, sector asegurador, bancario y sector salud, siendo este último de los menos explotados y de lo que se espera un desarrollo tecnológico para los próximos años.
Esto representará una gran inversión para las empresas al ayudarles, en la toma de decisiones para mitigar riesgos de seguridad, algo que puede ser la diferencia entre triunfar o ceder en el mundo de los negocios. A continuación podrás conocer la tendencia tecnología de Big Data en materia de seguridad y defensa:
- Sistemas de Defensa: Se enfoca en los sistemas integrados de Mando y Control en soporte de los escenarios de operaciones más complejos, como la defensa electrónica, la digitalización de las Operaciones o la vigilancia y control del espacio aéreo.
- Seguridad: En este se crean las tecnologías al servicio de la protección, para anticipar y hacer frente a todo tipo de amenazas.
- Ciberdefensa: Tiene por objetivo detener todo tipo de amenazas en el ciberespacio.
- Espacio: Orientado al uso de tecnologías espaciales aplicadas a operaciones militares.
- Soluciones de entrenamiento y servicios: Cubre todos los niveles de simulación civil y militar.
- Logística y Mantenimiento: Garantiza el desarrollo óptimo del ciclo de vida de los sistemas de defensa.
Ahora respondamos a la pregunta ¿Qué investigaciones de BIG DATA se hacen actualmente para la seguridad espacial?
Para ello contactamos al Laboratorio Nacional de Clima Espacial UNAM conocido por sus siglas como LANCE, para conocer el uso de Big Data en estudios de clima espacial, lo cual es un fenómeno global producido por la actividad solar que puede causar afectaciones a nuestra tecnología como lo son los satélites y por ende las comunicaciones.
Gracias al LANCE sabemos que actualmente se realizan varios estudios de actividad solar y tormentas geomagnéticas que utilizan técnicas de BIG DATA y machine learning que es un aprendizaje automático. Sin embargo en dicho Laboratorio aún no implementan estas técnicas en el monitoreo de actividad solar.
De igual forma entramos en comunicación con el Laboratorio de Ciencias GeoEspaciales conocido por sus siglas como LACIGE quien tiene como objetivo primordial, el formar parte de la campaña nacional que estudia objetos cercanos a la tierra y lo cuales pueden representar un riesgo, es decir la probabilidad que esto suceda y el impacto que genera si esto se materializa. El LACIGE utiliza un telescopio de 14" MEADE LX600 que lleva a cabo monitoreos constantes de las órbitas y parámetros físicos de tales objetos como lo son:
- Cometas
- Asteroides
- Meteoroides
BIG DATA en el espacio
En Laboratorio de Ciencias Geoespaciales hacen uso del Big Data principalmente, para la obtención de los parámetros físicos intrínsecos del asteroide, es decir su composición, velocidad o tamaño, valores que nos permiten inferir en el posible daño que uno de esto objetos podría ocasionar si se dirigiera a nuestro planeta. Los datos los obtiene de la base de datos del MPC (Minor Planetary Center) de la NASA para conocer parámetros orbitales de estos objetos y poder usarlos en modelos.
Ahora podemos intuir que el futuro de Big Data continuará evolucionando aceleradamente a la par de las tecnologías en donde seguirá mejorando la automatización de tareas y con ello predecir riesgos derivados del clima espacial, NEOs (Near Earth Objects) en nuestro país.
En otra instancia se podrán predecir y mitigar ataques cibernéticos a satélites como los supuestos ataques realizados al satélite de observación terrestre Landsat-7, construido por la NASA para el USGS, y el cual se sabe experimentó 12 o más minutos de interferencia en octubre de 2007 y julio de 2008.
De igual forma un satélite de observación terrestre Terra AM-1 administrado por la NASA fue interferido de manera similar durante dos minutos o más el 20 de junio de 2008, y al menos nueve minutos el 22 de octubre de 2008.
Por ultimo recordemos que el desafío más grande para Big Data es impulsar la evolución del ser humano positivamente, en el cual se puedan reducir los aspectos negativos derivados de la inteligencia artificial.
Por ahora el objetivo es que Machine Learning o aprendizaje de las maquinas sea con el uso de menos ejemplos lo cual se conoce como (small data) y por el contrario Big Data pretende incorporar valores humanos para la toma de decisiones y este se verá beneficiado en sus fuentes de datos con la llegada del reciente proyecto STARLINK de la empresa Estadounidense SPACE X.
Este proyecto se propone lanzar 12,000 satélites para ampliar la cobertura y brindar conectividad de internet a bajo costo, lo cual no solo traerá beneficios a las comunidades que actualmente no tienen cobertura, ya que Big Data también se verá beneficiado con la llegada de nuevas fuentes de datos que le exigirán mejores tecnológicas de procesamiento. Sin embargo recuerda que lo más importante en este momento es que podamos reducir los impactos negativos por el uso de este tipo de inteligencias artificiales.
¿Qué tan grande es el Big Data?
Pero seguramente en este preciso momento te preguntaras ¿Qué tan BIG puede ser? Para responder a ello debes tener presente que Big Data no se refiere a alguna cantidad en específico, pues lo mismo da hablar petabytes y exabytes que son simples unidades de medida de almacenamiento. Y lo cual podrás asimilar mejor si los asociamos con su aplicación en el mundo real. Por ejemplo:
Gigabyte = (una película)
Terabyte = (dos semanas de películas en DVD sin pausa)
Petabyte = (equivale a más de 13 años de televisión en alta calidad)
Exabyte = (a partir de aquí no existen comparativas reales)
Y en la actualidad existen de Zetabyte, Yottabyte, Brontobyte y Geopbyte. Pero no hagamos de este artículo una especialidad en unidades de almacenamiento.