Big Data: Separando la exageración de la realidad

No se puede pasar una hora en un evento de tecnología sin encontrar a alguien que defienda las virtudes Big Data. Todo el mundo quiere beneficiarse de ella – sin embargo, no todo el mundo entiende exactamente lo que es. Incluso la situación es peor, la realidad es que pocas  personas pueden obtener los beneficios de Big Data…por ahora.

Para los no iniciados, Big Data es una búsqueda de entender el significado de abundante información por medio del procesamiento de datos, de cualquier tipo, de volúmenes que son tan grandes o formas que son tan intensas que se hace difícil de procesar utilizando las aplicaciones tradicionales de procesamiento de datos.

Una pronta aplicación de este concepto misterioso en el trabajo, que utilicé en una vida anterior como analista de inversiones, es el software a cargo de los operadores financieros para crujir a decenas de miles de informes, resultados del mercado y otros contenidos no estructurados para evaluar las posibilidades matemáticas de activos de inversión.

Ahora las empresas de todo tipo se están vendiendo en la promesa de convertir los datos en oro. Pero, lo cierto es que aún no estamos allí – y es posible que pasen años antes de que la realidad se ponga al día con lo que se promete. Esto es lo que hay que tener en cuenta:

1. Proyectos de Big Data pueden ser muy costosos.

Todos podemos gracias a la Ley de Moore poner máquinas de gran alcance en la palma de nuestras manos -, pero la alquimia necesaria para extraer oro de los datos es de un orden diferente. Procesar grandes volumenes de datos requiere de computadores poderosos – estamos hablando de clusters de computadores.

Las empresas no son dueños de este hardware, lo alquilan – pero el alquiler de tiempo de procesamiento de los vendedores puede comenzar desde 1.000 dólares al día; Proyectos de Big Data de principio a fin pueden comenzar desde alrededor de $ 1000000 considerando todos los costos (Data Scientist, mantenimiento, etc.)

Estos precios dejan a las pequeñas y medianas empresas fuera del juego, y es un gasto grande incluso en las empresas más grandes.

2. Los algoritmos para Big Data no pueden resolver todos los problemas de la empresa

Los modelos estadísticos y computacionales reales utilizados en “grandes datos” son más aptos para resolver algún tipo de problemas mejor que otros. Son muy buenos para encontrar correlaciones entre los conjuntos de datos, pero no pueden entender si estas correlaciones tienen sentido.

Por ejemplo, cuando un algoritmo encuentra 5000 referencias a “gato”, realmente sabe cómo conceptualizar un gato? Cuando procesa la frase “Vi su pato (I saw her duck)”, Piensa que la chica se agachó (ducked=agachada) – o que ella mostró a su amigo con plumas (duck=pato)?
Estos son problemas científicos que todavía se están trabajando – y será de cinco a 10 años antes de que las empresas pueden obtener los tipos mágicos de beneficios de Big Data que se están vendiendo.

¿Solución? Esto es lo que podemos lograr hoy

Estos dos problemas son comúnmente publicitadas tareas Big Data – como traducción de masas , lo que requiere la extracción de datos de decenas de miles de documentos de texto y la realización de análisis de sentimientos estructurado en formularios de comentarios de los clientes para el personal de marketing , no están tan cerca como a las empresas se les hace creer .

Es por eso que digo que las empresas que quieran embarcarse en el carro de Big Data  comiencen con algo donde los grandes datos podrían funcionar mejor.

En Kuldat , por ejemplo , hemos decidido utilizar Big Data para centrarse en las tareas que se llevan a cabo mejor por los computadores en lugar de los seres humanos , lo que da a nuestros clientes una ventaja real cuando se ejecutan las solicitudes a través de la plataforma de salida .

Un ejemplo : las plataformas de grandes volúmenes de datos son una gran herramienta de marketing y permite a los equipos de ventas ganar una ventaja competitiva por medio de la valiosa información que se obtiene, analiza y conecta con el cuadro más grande a través de internet , como los nuevos artículos en industrias objetivo y la información más reciente sobre los movimientos de sus competidores.

Tener en mente … esto es sólo el principio

A pesar de todo el ruido sin fundamento por ahí acerca de Big Data, nos encontramos en un momento muy emocionante en su desarrollo. Big Data hoy es como la computación en la década de 1950, cuando las máquinas eran prohibitivamente caras y consideradas innecesarias para la propiedad a gran escala.

Al igual que la mayoría de la gente hoy posee un dispositivo de computación, todos los negocios pronto tendrán acceso a sus propias plataformas de Big Data. Pero por ahora, debemos dejar de lado las abrumadoras imposibilidades de escala Big Data y simplemente comenzar hoy con lo que podemos hacer antes de que podamos cosechar los mayores beneficios de la revolución de datos mañana.

Adaptado y traducido de Business2community.com. Ecrito por Marco Visibelly, Data Scientist. Link: http://bit.ly/1w8gaaw

Fuente Imagen: vint.sogeti.com