Big data y unas décimas de fiebre

Últimamente parece que sin Big data no se puede hacer nada. No es solo una de las grandes tendencias en proyectos tecnológicos, sino que en el área de marketing tiene un fuerte empuje (marketing y tecnología cada día están más unidos). Todo lo que cuentan sobre esta tendencia suena muy bien, y parece que es el avance lógico que necesitaba el “business intelligence” para poder seguir ayudando a mejorar el negocio.

Pero, ¿Que es exactamente esto del Big Data? Los proyectos del Big data pueden ser muy diversos, y tienen muchos factores en común (gran cantidad de datos y necesidad de sacar conclusiones). Hablemos de uno de los ejemplos más sonados para entender que es, y como puedo ayudarnos en nuestra vida.

En el año 2009, Google desarrolló un proyecto llamado Google Flutrends en el que intentaba averiguar cual era el alcance real de la gripe A (cepa H1N1). Hasta entonces, la única forma de realizar este tipo de estudios era con los datos recogidos en los CDC (Centros de detección y prevención de enfermedades), en los que cada 2 semanas se obtenían resultados.

Google contaba con la ventaja de tener una de las mayores bases de datos de búsquedas a nivel mundial. Por lo algunos de sus ingenieros publicaron en la prestigiosa revista Nature un articulo sobre la predicción de enfermedades a través de las búsquedas realizadas (recordemos que reciben más de 3000 millones de consultas). Para ello, compararon un listado de 50 millones de términos consultados relacionados con la gripe, con los datos históricos disponibles (desde 2003 al 2008). Otra de las ventajas con la que partian era la capacidad de poder procesar todos estos datos.

Diseñaron más de 450 millones de modelos matemáticos para enfrentar todos los datos disponibles, y finalmente concluyeron que la búsqueda de 45 términos mostraba una fuerte correlación con los datos históricos.  De forma que serían capaces de prever el impacto de la gripe teniendo en cuenta las búsquedas que hiciera los usuarios del buscador más famoso. Estos datos estarían disponibles en tiempo real, y servirían para poder realizar una planificación de recursos en centros hospitalarios, tomar decisiones más rápidas para ayudar a la población e informar a la sociedad de un hecho que les impactaba. Pero finalmente murieron de éxito, este proyecto salió a la luz, y mucho usuarios realizan búsquedas sólo por curiosidad, por lo que los resultados podían estar corrompidos y el algoritmo tuvo que ser re-diseñado.

Como hemos visto en este ejemplo, no solo basta con disponer de grandes cantidades de datos, sino que es necesario poder procesarlos y saber hacerlo. Pero los resultados son muy útiles y aplicables a cualquier otro ámbito, como puede ser el entorno corporativo.

Vivimos en un entorno en el que todo esta “datificado”. Es decir, hemos pasado a digitalizar datos analógicos de forma que podas medirlos y cuantificarlos. Por ejemplos los motores rolls-Royce de los aviones producen 4 TB de datos tras un vuelo oceánico, de forma que los ingenieros de tierra puedan realizar un mantenimiento mucho más efectivo. O sin ir más lejos, las smartcities, que producen un cantidad inimaginable de datos cada segundo. Pero es importante tener una estrategía de gobierno de información. La pieza clave es ¿Por que almacenamos estos datos? ¿Para que nos sirven? Es importante poder responder esta pregunta. Sino debemos replantearnos si lo que estamos haciendo nos lleva algún destino.

Por otro lado cabe destacar otro hecho, y es que se ha eliminado el muestreo. Con la tecnologías disponibles y los sistemas de almacenamiento de datos somos capaces de analizar todo el rango existente, lo que hace mucho más fiable y preciso cualquier estudio realizado.

Pensemos que vivimos permanentemente conectados (ya sea a nuestro portátil, smarphone, tablet, o sistema de navegación del coche). Por lo que estamos constantemente emitiendo datos sobre nuestra forma de consumo, nuestras aficiones, nuestros gustos,..Las empresas llevan tiempo recogiendo estos datos, pero están empezando a procesarlos y sacar conclusiones. la pregunta, que solo el tiempo nos contestará es, ¿Será en nuestro propio beneficio obteniendo mejores productos?

 

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s