Instituto de Astronomía potenciará observaciones de TAOS II
Por Karla Navarro
Ensenada, Baja California. 24 de febrero de 2017 (Agencia Informativa Conacyt).- Un centro de cómputo de alto rendimiento especializado en el almacenamiento masivo de datos fue instalado en el Instituto de Astronomía de la Universidad Nacional Autónoma de México (IAUNAM), campus Ensenada, para potenciar el aprovechamiento de los datos que se obtengan de las observaciones del proyecto Transneptunian Automated Occultation Survey (TAOS) II.
El objetivo principal del proyecto internacional TAOS II, que se desarrollará desde el Observatorio Astronómico Nacional (OAN), es la observación de ocultaciones estelares de objetos transneptunianos, es decir, ubicados en una órbita más allá de la del planeta Neptuno.
Sin embargo, los mismos datos que se produzcan durante las observaciones de los tres telescopios de TAOS II podrán ser aprovechados para obtener información sobre exoplanetas en estrellas desconocidas, caracterización de estrellas y otros temas de interés para los investigadores del Instituto de Astronomía.
En entrevista, el doctor Joel Castro Chacón, asignado al proyecto TAOS II a través del programa Cátedras Conacyt, destacó que el centro de datos ofrecerá la ventaja de obtener de primera mano los resultados del proyecto.
“Vamos a poder ver antes que cualquier otro científico lo que está descubriéndose y además vamos a tener oportunidad de hacer partícipes a los estudiantes y técnicos que estén involucrados; tenemos todos la oportunidad de participar en un proyecto grande y aprovechar todo el conocimiento y experiencias que nos pueda dejar”, resaltó.
50 mil estrellas
Una vez iniciado el proyecto TAOS II, se estima que por noche observará 50 mil estrellas, lo que en informática se traduce a tres terabytes (TB) de información diaria, espacio equivalente al disco duro de una laptop.
Joel Castro comunicó que estiman que dos petabytes (PB), que significan tres mil TB, serían suficientes para almacenar a nivel crudo toda la información que generará TAOS II durante los cinco años de duración del proyecto.
No obstante, a dicha capacidad se debe adherir el procesamiento de la información y la intención del Instituto de Astronomía de brindar un servicio a través del centro de datos a otras instituciones de investigación como la Universidad Autónoma de Baja California (UABC) y el Centro de Investigación Científica y de Educación Superior de Ensenada (CICESE).
“Estamos hablando de la pura imagen de pixel pero falta todo lo que son las curvas, todos los procesos, entonces la cantidad de información va a crecer hasta cinco petabytes”, calculó.
Procesamiento de datos
El centro de datos del Instituto de Astronomía actualmente se encuentra en funciones para el almacenamiento de datos, pero también con una sección de desarrollo de algoritmos computacionales necesarios para el manejo y extracción de información científicamente relevante.
Joel Castro explicó que el desarrollo de algoritmos computacionales es parte del trabajo que se requiere para potenciar la información que se obtenga de las observaciones de TAOS II, puesto que se procesará de forma automática para después ser interpretada por los astrónomos.
Informó que estas labores fueron iniciadas desde principios de 2016 y ya se cuenta con 80 por ciento de avance en todos los procesos que se requerirán.
“Estamos desarrollando líneas de proceso: introduces datos, los procesas y te dan la información que estás buscando. En Taiwán también desarrollaron su propio proceso para identificar las ocultaciones, de qué tamaño son los objetos y en dónde están”, mencionó.
Por la parte mexicana, además de los procesos para los objetos transneptunianos, también se están desarrollando las técnicas para la detección de exoplanetas y caracterización de variabilidad estelar, información que al integrarla a un código permite procesarla y extraer los datos de interés.
“Van a llegar los datos y en la mañana tenemos que correr nuestros programas, dejar el procesamiento y después tenemos que estar listos para recibir nuevos datos, no podemos tardar más”, adelantó Joel Castro.
Sistema de almacenamiento
Si bien el procesamiento para el que se está preparando el centro de datos es una tarea compleja, el funcionamiento del sistema de almacenamiento tampoco es simple.
En entrevista con la Agencia Informativa Conacyt, el doctor Benjamín Hernández Valencia, encargado de infraestructura y servidores del Instituto de Astronomía, campus Ensenada, apuntó que el centro de datos tiene actualmente instalada una capacidad de 440 terabytes de información.
Para organizar toda la información que recibe el centro de datos, se utiliza un sistema de archivos distribuidos denominado Lustre.
“Es un sistema de archivos como en Windows o en Linux, cada uno de los diferentes sistemas operativos tiene una forma de organizar cómo va a grabar la información en el disco físico, generalmente un disco magnético”, detalló.
Lustre, escalable y seguro
Benjamín Hernández indicó que la particularidad de Lustre es que, por ser un sistema de archivos distribuidos, el archivo se parte en diferentes secciones que se graban en distintos lugares del sistema.
Aclaró que Lustre es utilizado en sistemas de cómputo de alto rendimiento pero su función es únicamente almacenar, organizar de una forma coherente y distribuir el archivo.
Especificó que la habilidad del sistema es que puede crecer hasta 100 petabytes de información correspondiente a datos astronómicos, o bien 300 millones de archivos, puesto que es escalable y solamente se requiere instalar más discos duros sin el riesgo de perder datos.
“Lustre tiene como elementos principales un servidor de metadatos y una computadora con discos de muy alta velocidad, son discos de estado sólido que lo único que graban es la información de qué pedazo de tu archivo se encuentra en el sistema”, abundó.
El encargado de infraestructura y servidores del Instituto de Astronomía agregó que el almacenamiento real se distribuye en diferentes sistemas, denominados servidores de objetos, y cada uno de los servidores organiza los arreglos de disco.
Actualmente el centro de datos cuenta con 90 discos duros y tiene la capacidad de expandirse hasta con 280 discos adicionales, lo que se irá incrementando de forma gradual conforme las observaciones de TAOS II vayan avanzando.
Esta obra cuyo autor es Agencia Informativa Conacyt está bajo una licencia de Reconocimiento 4.0 Internacional de Creative Commons.