sábado, 4 de mayo de 2013

BigData Week Barcelona 2013. Parte I: ¿Qué es el BigData?

Hace unos días se celebró en Barcelona la BigData Week


El evento, lejos de centrarse en el BigData, intentó explicar la explosión de datos que estamos sufrido en los últimos años, las oportunidades que ello nos brinda y como abordarlas.

Agradecer a Sebastián Greco su aviso, sin el cual no habría descubierto el evento. Y aclarar que solo pude estar presente un día, el jueves 25 en el que se centraron las sesiones oficiales del evento. Sin duda, una visión muy limitada de la semana.

Durante el jueves asistí a 6 mesas redondas, en las que se dió mucha información, tanta como para 3 artículos en el blog. Así será:
  • Parte I: ¿Qué es el BigData? incluyendo la Introducción, Presentación y la parte más Política (y la que estás leyendo en estos momentos)
  • Parte II: OpenData y PersonalData. Dos de las fuentes de datos más importantes.
  • Parte III: Oportunidades de Negocio e Infraestructuras. ¿Es BigData otra burbuja tecnológica?
Como todos los comentarios bajo mi visión e interpretación. Y lo primero que noté es que había dos objetivos claros:
  • Definir de que estamos hablando: BigData, OpenData, PersonalData ¿cuándo aplica uno o el otro? ¿qué retos suponen? ¿que requisitos tienen?
  • Darle Valor a los datos, escucharas a quien escucharas te quedaba claro que nada de todo esto tiene sentido si no hay un retorno. No podemos vivir los datos por encima de nuestras posibilidades. Quedan lejos las ponencias donde se filosofaba sin objetivo de nuevas tendencias.

Presentación

Buzzword Bingo: Big DataLa BigData Week es una iniciativa organizada simultáneamente en más de 20 países y en Barcelona por media140. Empresa en la que me gustaría destacar a la encargada del evento: Mònica Garriga ... muy presente en twitter e incluso aportando en las mesas redondas.

Si bien se planteó el bien el evento, no se pudo luchar contra su mayor enemigo: el nombre.




Usar el marketing de un término (BigData) puede servir para llegar a cierto publico, pero en este caso se quería ir mucho más lejos: aclarando de que estamos hablando y enfocar el futuro. Estoy seguro de que si hubiera estado en su mano, la gente de media140 habrían escogido otro nombre.

El espíritu del evento se puede resumir en uno de los primeros comentarios del día:

De la primera mesa redonda me gustaría destacar a Carlos Scolari, con su exposición permitió que los asistentes (yo como mínimo), descubriéramos la semiótica y abriéramos la mente . Visualizar un análisis de las relaciones existentes entre los personajes de todas las obras de Shakespeare o descubrir la evolución cromática de los Mangas durante un periodo de tiempo, logró que estuviéramos preparados para cualquier cosa.

¿ cuánto de BIG ha de ser el BigData ?

Big ears
Estar abiertos a nuevas posibilidades es imprescindible para hablar de BigData, pero es necesaria una base. Por eso se intentó definir el término. Uno de los grandes problemas para mi personalmente y que, diría, logré durante el evento:

Se puede empezar a hablar de BigData cuando, con TUS recursos, tienes problemas para procesar TU información



En ocasiones nos limitará el tamaño,  pero si tuviéramos la infraestructura de Google seguro que no tendríamos problemas. Es posible que la sola complejidad de los datos nos impida analizarlos. Pero también, como bien comentó mi estimado Xavier Picamal, el caudal puede ser la frontera.  Aunque el volumen sea pequeño, si tenemos que procesar "al momento" un gran caudal de información, seguramente estaremos traspasando el límite de un análisis tradicional y tengamos que empezar a analizar otro tipo de soluciones.

Claves

Durante la presentación fueron saliendo los temas que para mi son clave cuando hablamos de análisis de datos. Algunos demasiado por encima, pero ahí estaban:
  • Seguridad, ¿de quién son los datos? ¿hemos tomado propiedad de los datos?
  • Legalidad, con el ejemplo de una startup que tardó un año en empezar sólo por los problemas legales
  • Estructura, muy por encima, pero la visualización de datos no deja de ser una solución al problema de una estructura compleja
  • Obtención, ¿ya tenemos los datos? ¿tenemos que recopilarlos? ¿de donde los sacamos?
  • Velocidad, una de las grandes ventajas del BigData :: tomar decisiones rápido... o mejor dicho "sin perder el tiempo" @cscolari

El Fin Último del Análisis de Datos

Big Ass No se planteó así, quizás solo fue por la gran presencia de Administración publica en el evento, quizás por lo llamativo o polémico que puede llegar a ser, pero de lo primero que se habló fue de si es posible medir la opinión de la población en las redes sociales.

Tras la noticia de que Barack Obama creo un equipo de analistas de información para que le asesoraran durante las elecciones a la presidencia, muchos están intentando seguir la idea. A mi la idea me parece un fin último e inalcanzable, ya sólo podremos saber la opinión de alguien, en un instante de tiempo. Y aunque tuviéramos TODA su información, espero sinceramente que jamás tengamos la capacidad para procesarla.

Un tema más filosófico que técnico o de negocio, y que es fácil que se abra cuando se habla de análisis de datos. Evidentemente estos temas quedan reducidos a análisis de redes sociales, y durante la presentación ya se habló del sesgo de selección que suponía usar solo datos de twitter, debido a que sus usuarios tienen un perfil concreto de usuario de nuevas tecnologías.

Es por eso que me sorprendió encontrarme con afirmaciónes tan rotundas viniendo de un político:
Imagenes: Buzzword Bingo: Big Data, Big ears y Big Ass