40% más de productividad de los científicos de datos
17 septiembre, 2018
Capacidades Aumentadas con Inteligencia Artificial
6 noviembre, 2018
Ver todo

El futuro… Lagos de datos?

Los lagos de datos empresariales han sido presentados como la panacea organizacional. Allí se depositarán todos los datos para poderlos analizar. Sin embargo, su estructuración para un adecuado desempeño realmente requiere de un verdadero estudio del motivo de agregación de información y uso que se espera hacer de la misma para poderlo definir adecuadamente y que pueda satisfacer las necesidades que le dieron origen.

Gartner presenta en su artículo “How to avoid data lake failures”. Cómo evitar las fallas en los lagos de datos, tres escenarios comunes hoy en día en los que se presentan fallas en la conceptualización de los lagos de datos:

  1. El lago de datos empresarial.
  2. El lago de datos es mi estrategia de datos y analítica.
  3. El lago de datos infinito.

How to avoid data lake failures: https://gtnr.it/2xsGHXR

El concepto de tener un único lago de datos para todo propósito y necesidad parece no estar cumpliendo las promesas.

Los lagos físicos tienen unos tamaños definidos, tienen unos procesos de desagüe y evaporación que regulan su tamaño, y claramente no pretenden alojar todas las especies de peces, ni satisfacer las necesidades de agua para todas las ciudades.

Necesitamos pensar el objetivo para la creación del lago de datos, la conveniencia del lago y de los procesos de regulación de los datos. La arquitectura de soporte y uso de los datos que en ellos se almacenen debe ser diseñada de acuerdo con el uso que se le pretenda dar. Se deben pensar las preguntas que se requerirá responder, pues su estructura deberá ser diseñada de acuerdo con el uso esperado en el futuro.

No es lo mismo diseñar un lago para una hidroeléctrica que para el suministro de agua a un distrito de riego. Requieren infraestructura y diseños diferentes para cumplir a cabalidad sus funciones. Sin funciones, el diseño puede fallar. Dependiendo del diseño y ubicación se verán las especies de peces que puedan allí vivir. Al igual ocurrirá con nuestros lagos de datos empresariales, en donde si no definimos adecuadamente lo que esperamos lograr, quizás no lleguemos a contar con los datos para tomar el tipo de decisiones que esperemos lograr en el futuro.

La analítica (redes) sin su insumo correcto de datos (peces), no llegará a brindar los resultados que las organizaciones requieren tan solo por haber acumulado en un único depósito desestructurado toda la información empresarial. Gartner nos lo indica, validemos si el lago de datos es lo que se requiere y conviene, diseñemos el lago para funciones específicas y consideremos las capacidades y experiencia de nuestro equipo de personas que analizarán la información para definir realmente las expectativas y arquitecturas que debemos emplear.

Autor invitado:

Sergio Gutiérrez
Presidente INFÓRMESE

#DataLake #INFÓRMESE #Analítica #Datos #DecsionesInteligentes