Nuevas tecnologías para personas sordas
Por Israel Pérez Valencia
Santiago de Querétaro, Querétaro. 19 de enero de 2017 (Agencia Informativa Conacyt).- En el marco del Primer Congreso Internacional de Tecnología de Sordos, organizado por el proyecto World Deaf Tech y la Comisión de Personas Sordas del Estado de Querétaro, A.C. (CPSEQ), se llevó a cabo la presentación de proyectos tecnológicos enfocados en promover una mayor inclusión de las personas sordas en la sociedad.
El primer proyecto es un traductor de la Lengua de Señas Mexicana a voz y texto en tiempo real; un sistema que a través de sensores y algoritmos de inteligencia artificial tiene la capacidad de capturar e interpretar las señas de una persona para su respectiva traducción en palabras. Este proyecto fue diseñado por el egresado de la maestría de tecnologías de cómputo aplicado de la Universidad Tecnológica de la Mixteca en Huajuapan de León, Oaxaca, Gibran García Bautista, con la asesoría del profesor investigador de esa institución, Felipe Trujillo Romero.
Gibran García Bautista detalló que este sistema consiste en un sensor Kinect que almacena información en una base de datos RGB-D para dar el seguimiento, interpretación y traducción de las posiciones del esqueleto humano para después procesarlas y realizar el reconocimiento con redes neuronales/DTW para la generación de palabras en texto y audio.
“Este proyecto inició con mi tema de tesis, que era solamente la creación de un corpus lingüístico de la lengua de señas; entonces yo cree un programa que, a través del Kinect, podía captar información y almacenarla en la base de datos para después obtener una nube de puntos para la recreación de modelos tridimensionales de las personas, y con diferentes implementaciones de algoritmos para obtener la información o el patrón que yo deseaba”, explicó.
García Bautista puntualizó la importancia de utilizar redes neuronales artificiales en el diseño de este sistema traductor de la lengua de señas mexicanas, pues son necesarias para poder hacer una correcta clasificación de las palabras, y con ello evitar errores en el proceso de traducción.
“La red neuronal se asemeja a una biológica. Yo estoy utilizando una de tipo Backpropagation con la que se busca minimizar errores. El punto de una red neuronal es que se le presenta un vector característico o patrón, que puede ser una palabra, misma que la red procesa con una base de datos ya existente, y es capaz de clasificarlas para evitar que se confundan, por muy parecidas que parezcan, y así obtener un modelo de clasificación”, agregó.
El egresado de la maestría en tecnologías de cómputo aplicado abundó que este proyecto, que nació para ofrecer una alternativa de comunicación con las personas sordas, ha tenido una proyección importante a través de la redacción de artículos y presentaciones en instituciones del extranjero.
“Formo parte de una organización que se llama Sociedad Internacional de la Óptica y la Fotónica (SPIE, por sus siglas en inglés) que se encuentra en Estados Unidos, donde redacté un artículo sobre el proyecto y fue aceptado para ir a presentarlo allá. También tuve la oportunidad de presentarlo en un congreso en Tucson, Arizona. Este proyecto lo pude desarrollar con los recursos que obtuve por ser becario del Consejo Nacional de Ciencia y Tecnología (Conacyt) y de la Universidad Tecnológica de la Mixteca en Huajuapan de León”, señaló.
Gibran García Bautista indicó que el proyecto se encuentra en la etapa de complementar el corpus lingüístico del sistema, lo cual se está haciendo con el apoyo del Centro de Atención para Estudiantes con Discapacidad (CAED) para realizar las grabaciones.
“Tenemos 80 por ciento del corpus terminado; esto es importante porque no hay referencias respecto a una base de datos semejante, por lo que tendríamos el corpus lingüístico tridimensional de lengua de señas a nivel nacional, pero para ello requerimos de más apoyos, tanto para terminar el prototipo como para desarrollar la patente”, finalizó.
Dilo en Señas, aplicación para teléfonos móviles
Otro de los proyectos presentados en el Primer Congreso Internacional de Tecnología de Sordos, fue Dilo en Señas, aplicación para teléfonos móviles o tabletas cuyo objetivo es promover el aprendizaje de la Lengua de Señas Mexicana a través de juegos dirigidos para niños y con ello fomentar la inclusión de los menores sordos, desarrollado por Gerardo Monsiváis González y Rocío Garza Gutiérrez, quien explicó que el proyecto surgió ante la necesidad de comunicación que existe entre sordos y oyentes en su ámbito laboral.
“Yo trabajé en una empresa en la que contrataron a Gerardo, que es sordo y actualmente es mi socio en el proyecto. En ese momento me preocupó que la empresa no estuviera lista para tener empleados con esta discapacidad. Fue difícil su capacitación pero aprendí mucho en todo el trayecto; eso fue lo que en una primera instancia generó la idea de desarrollar el proyecto”, recordó.
Garza Gutiérrez detalló que Dilo en Señas es un proyecto que tiene como base tanto la experiencia vivida entre personas sordas y oyentes, así como un proceso de investigación en tendencias, procesos y prácticas colaborativas e innovación tecnológica.
“Empecé un doctorado en educación inclusiva, en la Universidad de Baja California. Yo soy ingeniera en sistemas, estudié en el Instituto Tecnológico y de Estudios Superiores de Monterrey (ITESM) campus Monterrey, y la maestría en educación. Me interesó mucho ese doctorado y mi tesis la hice sobre sordera. Fue cuando surgió la idea de crear esta aplicación, porque me di cuenta que el problema raíz de una persona sorda es no tener un desarrollo del lenguaje natural en la primera infancia, que realmente eso afecta a personas oyentes también”, explicó.
Rocío Garza Gutiérrez informó que la aplicación Dilo en Señas, que ya está disponible en Google Play y en Apple Store para celulares y tabletas Android, lleva, a once meses de su lanzamiento, más de 107 mil descargas. Esta versión incluye dos funciones que son: Practicar, para poder observar las señas y aprenderlas, y Jugar, donde se pueden ver videos de las señas para seleccionar imágenes y ganar puntos.
“La primera versión de Dilo en Señas tiene 89 señas en siete categorías: Familia, Alimentos, Juguetes, Animales, Colores, Números y el Abecedario. La idea es relacionar videos con imágenes, aprendiendo una serie de palabras del lenguaje básico de los sordos. Se ingresa a la categoría, y aunque se equivoquen se va dando un aprendizaje a través de estos juegos”, aclaró.
La creadora de Dilo en Señas detalló que esta aplicación ha obtenido reconocimientos como el tercer lugar en Aplicaciones Educativas en México, el premio Cemex-Tec 2016 en la categoría de Emprendedores Sociales, así como el premio Incluye 2016 en la categoría de Sensibilización.
“La siguiente etapa sería agregarle más contenido y queremos poco a poco más funcionalidad, también a la aplicación, pero principalmente nos estamos convirtiendo en una asociación para poder ofrecer más productos y servicios y recibir donativos para seguir apoyando, porque sí queremos mantenerla gratis para todo el público”, finalizó.
• Ing. Gibran García Bautista
Desarrollador del proyecto Traductor de la Lengua de Señas Mexicana a voz y a texto en tiempo real
Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.
•Rocío Garza Gutiérrez
Desarrolladora del proyecto Dilo en Señas
Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.
Esta obra cuyo autor es Agencia Informativa Conacyt está bajo una licencia de Reconocimiento 4.0 Internacional de Creative Commons.