Rosa María Cantón Croda
“El verdadero ingenio está en la capacidad para la evaluación de la información incierta, peligrosa y conflictiva” Winston Churchill
La mayoría de los tomadores de decisiones hablan de tener datos, pero no consideran que éstos son hechos concretos o cifras carentes de significado. Los datos primero deben ser procesados y puestos en contexto para que se vuelvan información; pero, como cita Ruterford, lo anterior no es suficiente para llegar al conocimiento. Este último requiere de experiencia para interpretar, asimilar y averiguar qué ocurre. Así, como último peldaño, se realiza un proceso cognitivo de análisis y comprensión para que la información se convierta en conocimiento. La toma de decisiones en cualquier ámbito laboral o personal vive la recolección de datos, su transformación en información y posterior análisis para generar resultados óptimos (conocimiento)[1].
Otro punto por considerar es el ciclo de vida de los datos, es decir, el lapso en el que los datos existen desde el momento de su creación, hasta su transformación: evolución, modificación, reutilización o destrucción. El ciclo de vida de los datos se conforma por tres etapas. La primera, adquisición y creación, refiere al proceso en el que los datos se obtienen o transfieren al sistema, lo que implica construir archivos, clasificarlos para facilitar su recuperación y determinar los controles de acceso. Hecho lo anterior, sigue la etapa de retención y protección de datos enfocada en almacenarlos y conservarlos; en otras palabras, se trata de garantizar la redundancia de los datos mediante respaldos, el cifrado, asegurar su exactitud y la seguridad física del servidor. La tercera y última etapa se refiere a la retirada de los datos en el sentido de que hay que deshacerse de ellos cuando no son útiles[2].
Si no se toma en cuenta el ciclo de vida de los datos, se puede llegar a tener problemas como los del Reino Unido duranta la actual contingencia sanitaria. El gobierno británico tuvo un fallo técnico en el que perdió 16000 casos de personas que habían dado positivo a la enfermedad coronavirus. Lo anterior ocurrió porque el laboratorio encargado de las pruebas no tenía el conocimiento de que Excel tiene un límite de almacenamiento de 1.048.576 filas por 16.384 columnas. En otras palabras, el laboratorio no llevó a cabo de forma eficiente la fase 1 y 2 del ciclo de vida de los datos.
El fenómeno anterior, y la generación exponencial de datos en las plataformas digitales, han hecho que la Ciencia de Datos e Inteligencia de Negocios[3] se convierta en una de las profesiones más demandadas por los empleadores en nuestro país y en el mundo. Entre sus objetivos destaca formar profesionistas que sepan identificar las diferentes problemáticas que surgen a lo largo del ciclo de vida de los datos.
[1] Fayyad, U., Shapiro, G., From Data Mining to Knowledge Discovery in Databases, En: Al Maganize 17.3 (1996), págs. 37-54.
[2] Rivadera, G. R. (2010). La metodología de Kimball para el diseño de almacenes de datos (Data warehouses). Cuadernos de Ingeniería, (5), 56-71.
[3] Maestría en Ciencia de Datos e Inteligencia de Negocios. UPAEP. https://upaep.mx/maestrias/ciencia-de-datos-e-inteligencia-de-negocios