Big Data: “Todos somos grandes generadores de datos”
El doctor Esteban Feuerstein, expositor en la 44º edición de las Jornadas Argentinas de Informática (44 JAIIO), que se desarrollaron en Rosario, desde el 31 de agosto al 4 de septiembre analizó los usos actuales del Big Data.
Los Grandes Datos o Big Data están hoy en todos lados: surgen desde la tremenda cantidad de interacciones que se producen entre las personas en las redes sociales, pasando por el enorme número de datos que se recolectan en las transacciones comerciales y financieras, incluso cada producto que pasa por la caja de un supermercado.
En nuestra vida cotidiana aparecen multiplicidad de fuentes generadoras de datos, por ejemplo, en la en industria del petróleo, la incorporación de sensores metro por metro para distinguir las vibraciones de una parte del terreno en comparación con otra, permite dirigir mejor la exploración. En la logística del transporte urbano de pasajeros, el GPS de los colectivos, de los taxis, hacen que se puedan estar enviando, almacenando y procesando señales a medida que se reciben.
Es por eso que Feuerstein enfatizó que “todos somos grandes generadores de datos, y ese es el gran cambio que hubo en el modelo tradicional, donde unos pocos producían datos, ahora todo el mundo tiene la capacidad de producirlos y aprovecharlos”.
Esteban Feuerstein es director del programa de Ciencia de Datos de la Fundación Sadosky, docente, investigador y Director del Departamento de Computación de la Facultad de Ciencias Exactas y Naturales de la Universidad de Buenos Aires, y en el marco de las JAIIO cordinó el AGRANDA: Simposio Argentino de Grandes Datos además de dar una charla en ASSE: Simposio Argentino de Ingeniería de Software.
El cambio: una posibilidad
Los Grandes Datos (Big Data) se refieren a todas las herramientas, tecnologías, métodos y sistemas que se requieren para manejar conjuntos de datos distribuidos, heterogéneos, tan grandes y complejos, que son imposibles de analizar con los métodos tradicionales de procesamiento y administración de bases de datos. “Se tomó conciencia de que la generación de datos a todos los niveles está alcanzando un volumen nunca antes visto, y sigue creciendo” señala el investigador.
El crecimiento del volumen de datos vino acompañado de un incremento en la capacidad de almacenar y también de procesar, y todo esto implicó una nueva manera de pensar, “que se instaló en muchos ámbitos, como la ciencia, la ingeniería, los negocios, las finanzas” indica Feuerstein, y agregó que “esta nueva mirada incorporó la posibilidad de hacerse y contestar preguntas a partir de los datos, que no se habían hecho antes”.
Hay Grandes Datos en lo que se llama internet de las cosas, por ejemplo, hay sensores en todos lados: las heladeras tienen sensores, una cosechadora puede contar metro por metro cuantos granos recolectó y puede distinguir un sector de tierra del cuadrado de al lado en cuanto a su características de suelo, de humedad, de pendiente, y todo eso implica la posibilidad de, por ejemplo, aplicar lo que se llama Agricultura de precisión, que aprovecha la información recolectada para realizar con mayor precisión las tareas de fertilización, siembra, riego, que hace un tiempo era imposible” aclara Feuerstein.
Al respecto al cambio de paradigma que está permitiendo el trabajo con grandes volúmenes y diversidad de datos, Feuerstein destaca “La posibilidad que aparece, de reunir tantos datos, observarlos, analizarlos y descubrir nuevas cosas, ese es el cambio, lo nuevo. Por supuesto que eso trae permanentemente desafíos, en la forma, en cómo hacer para almacenar todos esos datos, cómo hacer para procesarlos eficientemente, y a la vez, cómo hacer para generar cada vez más, es toda una rueda que se retroalimenta”.
La informática siempre tuvo el desafío de los grandes datos, siempre el objetivo fue poder procesar más datos de lo que se podía, señala el doctor Feuerstein y continúa explicando “Cada vez que se corre la frontera aparecen nuevos desafíos, desde el punto de vista de la ingeniería del software, uno de ellos podría ser cómo construir programas más robustos que puedan llevar adelante la misión de procesar grandes caudales de datos, y un punto muy importante tiene que ver con la interdisciplinariedad, los campos de aplicación son tan vastos y diversos, no se trata sólo de problemas para informáticos, sino también para matemáticos, estadísticos, economistas, psicólogos, se van mezclando los campos de aplicación y las herramientas que hay que construir, los retos, ahora son interdisciplinarios” resalta Feuerstein, y finaliza así su reflexión:“La visualización de los datos, la posibilidad de transmitir, mostrar y convertir esos datos en información utilizable, es más difícil cuantos más datos y más diferentes son”.
Comentá esta nota