Big Data, una mina de oro

bigdata

 

Empecemos definiendo qué es Big Data (grandes datos) como un conjunto de datos de todo tipo que es tan grande, complejo y dinámico para que se pueda ser capturado, almacenado, administrado y analizado en un tiempo razonable con las herramientas convencionales de manejo de datos. Big data no es solo cantidad sino también calidad de datos, mencionaba Andrew Lippman, fundador de Media Lab de MIT hace unos días.

En los últimos días en lomasnuevo.net hemos estado escribiendo sobre las tendencias de la tecnología en donde la movilidad está creciendo exponencialmente, y acompañado con esto la cantidad de datos que se tienen que manipular, y la razón es que la tecnología está por todos lados cada vez en más dispositivos.

El análisis de los datos ha sido muy útil para las empresas y sitios web que buscan conocer cada vez mejor el comportamiento de sus clientes, usuarios o consumidores, es por esto que han visto una mina de oro en las herramientas Big Data empezando a alinearse para ser data-friendly y agilizar el negocio.

Big Data se refiere entonces a las herramientas, procesos y procedimientos que permiten a una organización crear, almacenar, administrar manipular y consultar grandes cantidades de datos (terabytes, petabytes, o incluso zettabytes).

Es sorprendente que cada día creamos 2.5 quintillones de bytes en datos, y lo más sorprendente es que el 90% de los datos almacenados en el mundo hoy en día fueron creados en los últimos dos años. En 2020 la cantidad de datos será 50 veces mayor que en la actualidad.

Los datos vienen de todas partes: información empresarial, llamadas telefónicas, sms, navegación web, redes sociales, películas, fotografías, compras, gps, sensores, etc.

big-data-300x298

 

Big data tiene 4 dimensiones:

Volumen: las empresas buscan obtener mayor cantidad de datos cada segundo, llegando a petabytes o zettabytes.

Velocidad: algunas veces dos minutos es demasiado tiempo para obtener un dato, las herramientas big data permiten analizar millones de registros en tiempo real.

Variedad: Big data no está limitado a un tipo de dato, puede ser texto, audio, video, logs, etc.

Veracidad: La información debe ser consistente y veraz, de lo contrario no cumple su objetivo.

img_bigdata

Lamentablemente para las empresas no es tan fácil entrar a esta nueva tecnología, se afrontan varios retos: se necesita gente capacitada, muchas empresas no saben que puede hacer big data por ellos, la tecnología es un factor importante ya que debe estar madura para poder aprovecharla al máximo.

Los pasos típicos que una empresa debe seguir son: empezar a experimentar y acompañarse con consultorías, crear una mezcla de tecnología tradicional y esta nueva tecnología luego vendrá un largo proceso de transición a un modelo maduro de big data.

Las grandes empresas de tecnología como Google, Amazon, Facebook ya están exprimiendo Big Data (están obligados o quedan fuera) y por eso es que vemos que cada día nos conocen mejor.

La semana pasada en lomasnuevo.net escribimos acerca de lo nuevo en Blackberry, cuya estrategia pasa por Big Data y esto cada vez se pone mejor.

Ejemplos de las razones de big data:

Un avión genera 640TB de información de sensores en cada vuelo. Cada motor genera 10TB cada 30 minutos.

12 TB de Tweets, 400 millones de tweets por día

En la bolsa, NYSE genera 1TB de transacciones cada día.

Big-Dataposter