Estudian fenómeno de la violencia en México
Por Tomás Dávalos
Aguascalientes, Aguascalientes. 17 de abril de 2017 (Agencia Informativa Conacyt).- A partir de la filtración de una base de datos sobre la llamada guerra contra el narcotráfico, los investigadores Alejandro Madrazo Lajous y Laura Atuesta Becerra, del Centro de Investigación y Docencia Económicas (CIDE), en colaboración con María del Pilar Fuerte y Óscar Sánchez Siordia, del Centro de Investigación en Geografía y Geomática (Centrogeo), elaboraron la Base de datos CIDE PPD, que brinda información pública sobre enfrentamientos y homicidios ocurridos entre 2007 y 2011, esto, a fin de impulsar su análisis para generar políticas públicas con relación al narcotráfico y la seguridad.
En entrevista para la Agencia Informativa Conacyt, Alejandro Madrazo comentó: “Esto (la base de datos) lo llevé y toqué base con el Programa de Periodismo del CIDE, porque como era información filtrada, lo primero que quise saber es cómo verifica uno que una información filtrada es buena, entonces tras hablar con Ricardo Raphael, que era el director del Programa de Periodismo, llegamos a la conclusión de que era posible que sí fuera una buena base de datos y que había que realizar algún tipo de verificación”.
Entonces se propusieron diferentes mecanismos para verificar los datos y, a la par, se presentó el caso a los directores del CIDE para definir qué se haría con la información, esto, debido a su importancia. De manera conjunta, se tomó la decisión de crear una base de datos que sería codificada por este centro de investigación.
“Para mí era muy importante que esto no fuera contaminado desde fuera (...) Quería que fueran fondos internos. El CIDE terminó financiando la codificación en colaboración con Centrogeo”, señaló.
Con relación a la participación del Centrogeo, dijo que conversando con investigadores de este centro respecto al trabajo que estaban realizando, salió a la luz que ellos tenían la capacidad de verificar los datos a través de fuentes de Internet, fue entonces cuando se decidió trabajar en la validación y codificación de la Base de Datos CIDE PPD de manera conjunta.
Alejandro Madrazo detalló que a partir de la información contenida en la base de datos, se realizan estudios sobre cómo la violencia afecta la capacidad de gobernar de los municipios, la evolución del crimen organizado a través de los narcomensajes, las formas de morir de los periodistas en el contexto del crimen organizado y la geografía de la violencia en México, entre otras cerca de 20 líneas de investigación que se están desarrollando.
La filtración y su análisis
Por su parte, Laura Atuesta, profesora investigadora del CIDE, recordó que durante el gobierno de Felipe Calderón Hinojosa, la Presidencia de la República publicó hasta el año 2011 una información denominada Base de datos de fallecimientos ocurridos por presunta rivalidad delincuencial, a la que popularmente se le conoció como el “ejecutómetro”.
“Esto generó una cantidad de controversias en los medios, hasta que después de un año decidieron quitarla del portal porque no tenía fundamentos jurídicos, porque no se sabía muy bien qué metodología habían hecho para incluir esos fallecimientos en esa base de datos. A partir de entonces, no se tiene más información acerca de los fallecimientos que están relacionados con la guerra contra el narcotráfico en México”, mencionó.
Aquella base de datos se dividía en tres categorías: agresiones, enfrentamientos y ejecuciones. En términos generales, era un registro de las muertes que habían ocurrido en cada uno de los municipios y estaban presuntamente relacionadas con la guerra contra el narcotráfico. Las cifras se habían concentrado de manera mensual.
“Esa base vino acompañada de una guía metodológica que también se bajó de Internet y ya no está disponible, en la guía metodológica explicaban un poco el proceso de cómo se había conformado la base de fallecimientos (…) La base de datos contenía información del 2006 al 2010, estaba agregada por municipio, por mes, y uno podía más o menos comparar esta información con la base de datos de homicidios del Inegi (Instituto Nacional de Estadística y Geografía) y sacar algo de conclusiones acerca de la guerra contra las drogas”, explicó.
La base de datos incluía 36 mil archivos, y al trabajar en su análisis observaron que tenía las mismas características y categorías del ejecutómetro: agresiones, enfrentamientos y ejecuciones. Los registros que presentaba esta base de datos no se limitaban al agregado de homicidios, pues cada microdato incluía el registro individual de cada uno de los eventos: información de las personas involucradas, sobre cómo habían muerto y la fuerza pública que había estado involucrada en el enfrentamiento.
“Al darnos cuenta que las categorías eran las mismas, lo primero que hicimos fue agregar todos los homicidios y comparar los homicidios agregados con los homicidios que estaban o que habían sido publicados en la base de fallecimientos (…) Nosotros tenemos un año más de información, pero de 2007 a 2010 los datos eran exactamente iguales a los datos que se habían publicado en Presidencia. La gran diferencia era que nosotros teníamos el detalle de todo lo que había pasado, mientras que en Presidencia solamente su publicó el agregado de los homicidios por municipio y por mes”, subrayó.
Normalmente, dijo, lo que hacían los investigadores era contrastar estos datos con los homicidios que se reportan en el Inegi, pero el problema al utilizar la información del Inegi es que se desconoce la causa del asesinato, y para estudiar la guerra contra las drogas en México se requiere certeza al atribuir una ejecución específicamente a la estrategia de seguridad que se implementó en México.
“Ahí fue cuando nosotros empezamos a hablar acerca de qué hacemos con esta información, porque obviamente es una información importante, pero el tema es que es información súper sensible, porque tenía una cantidad de datos que no podemos sacar al público, simplemente porque estamos poniendo en riesgo la seguridad de personas que estuvieron involucradas en esos eventos, entonces decidimos crear una base de datos que ahora llamamos la Base CIDE PPD”, manifestó.
Validación y codificación de la información
Laura Atuesta refirió que a partir de la base filtrada se hizo un proceso de validación y codificación para crear la Base CIDE PPD. Como primer paso era necesario validar la información para poder asegurar su veracidad, pues al no tener una fuente sobre el origen de la base de datos, se tenía que verificar que su contenido fuese correcto; posteriormente, se procedió a codificar la información para quitar todos los datos sensibles que contenía la base madre: nombres de personas, números de averiguaciones previas y actas circunstanciadas.
“Para el proceso de validación, lo que hicimos fue una búsqueda automática de cada uno de los eventos en Internet. Trabajamos con Centrogeo, ellos crearon un sistema en el cual bajaban automáticamente links de Internet, bajaron en promedio 20 links por cada uno de los eventos, estos links fueron buscados con base en información específica, es decir, la fecha y el lugar donde pasó el evento, si había nombres de las personas involucradas en el evento, buscábamos el nombre, el modo de muerte y si había grupos involucrados y las armas utilizadas en el evento”, subrayó.
Posteriormente, se instaló un sistema de validación, para ello se contrató a cuatro asistentes de investigación de tiempo completo, quienes tuvieron que ingresar a cada uno de los links que se habían encontrado, para cotejar si la información que se tenía en la base de datos era exactamente la misma que aparecía en las noticias de Internet.
“La base madre tenía mil 561 registros de agresiones, en enfrentamientos tres mil 835 y en ejecuciones 30 mil 982. Entonces en la primera categoría encontramos solamente 29 por ciento de los eventos publicados en prensa, en el segundo 23 por ciento y en el tercero 48 por ciento. Se puede pensar que estos números son bajos, pero hay un millón de explicaciones: uno, la prensa no publica y no reporta absolutamente todo lo que pasa en la guerra contra el narco; hay diferencias temporales, al principio se publicaba más, ya después se publicaba menos; hay diferencias espaciales, estados como Tamaulipas no reporta, otros estados reportan mucho más”, precisó.
Una vez validada la base de datos, se inició el proceso de codificación. La información filtrada incluía una descripción de los eventos en la cual se detalla qué había sucedido, se tenía además los nombres de los presuntos involucrados, de las víctimas, de los detenidos, lesionados, lugares específicos, amenazas en los mensajes e identificadores como credenciales de elector o averiguaciones previas. Toda esa información se quitó y se incluyeron variables dicotómicas, en las cuales se especifica si el evento tiene o no tales características.
“Se hizo una base de datos que empezó de ceros, abrimos básicamente una hoja de Excel y empezamos punto por punto a poner información de ceros, para asegurarnos de que no tuviera información sensible. Dentro de la base de datos que tenemos, está igual, dividida en tres categorías: enfrentamientos, agresiones y ejecuciones. Enfrentamientos puede estar dividido en participación estatal y enfrentamientos entre grupos del crimen organizado; las agresiones son agresiones a la autoridad, y tenemos información de la agresión, quién fue el agredido y qué tipo de agresión fue; y en las ejecuciones, son muertes presuntamente relacionadas con actividad delincuencial”, añadió.
Con la Base de Datos CIDE PPD se pueden identificar grupos del crimen organizado involucrados en los eventos, cómo se mueven estos de lado a lado en México, cuántos muertos hubo, cuál fue el modo de muerte y la profesión del ejecutado, siempre y cuando los datos hayan estado disponibles.
“La base de datos no está libre de sesgos. El primer tipo de sesgo que encontramos es la fuente de la base, es una base filtrada, pero creemos que este sesgo disminuye bastante con el proceso de validación, y hoy en día si quieren usar la base se puede citar al CIDE como fuente, sabiendo que el CIDE hizo un proceso exhaustivo. El segundo sesgo es la forma en cómo se originó la base de datos, tiene que tener en cuenta que es una base de datos oficial, es decir, fue originada desde el gobierno”.
Para concluir, la profesora investigadora del CIDE sostuvo que la idea es que la Base de Datos CIDE PPD la use la mayor cantidad de gente posible, por ello la información está abierta al público, si bien precisó que dichos datos deben utilizarse con cautela.
Esta obra cuyo autor es Agencia Informativa Conacyt está bajo una licencia de Reconocimiento 4.0 Internacional de Creative Commons.