Big Data, Commodity Digital

Big Data, es un concepto que suena en todos lados hoy en día y pareciera ser muy normal, tanto como Big foot o Big Sur, mucha gente lo emplea pero la verdad es que no todos saben muy bien a qué se refiere específicamente o que importancia tendrá en nuestro futuro inmediato. Llamar a la información” data” si bien es un término correcto, suena un poco como esas películas de los 80´s donde se veía un ordenador con muchísimos 0,1,0,1,1,1,0,0 que desfilaban en secuencia llenando la pantalla verde de filas de código. Sin embargo la data es un concepto totalmente relevante hoy por hoy, y gracias a internet podemos tener información en tiempo real de todos los procesos que mueven nuestro mundo y esa información vale mucho dinero.

 

Aviones monitorizados en vuelo sobre USA en día cualquiera

 

 

¿Qué es Big Data?

El Big Data es un término bastante amplio, muchas cosas caben dentro de este concepto y ya ha alcanzado dimensiones filosóficas. Pero yo lo abordaré desde un punto de vista tecnológico y económico.

Todas nuestras interacciones con aparatos electrónicos, ya sean dispositivos móviles, de vídeo, audio, sensores de maquinarias industriales y wearables, dejan tras de sí una huella digital en forma de código binario, esta huella digital puede ser medida por un programa diseñado para registrar, segmentar y analizar estas grandes cantidades de data. Ese volumen inmenso de datos e información  que no puede ser capturados por un software normal es el “Big Data”.

Desde que el uso de internet se ha masificado, cada día nos volvemos más hiperconectados, en todo momento  generamos un flujo de información inagotable, hace años esos datos no tenían un uso práctico porque las compañías de internet y hosting eliminaban este Raw Data, o data cruda de sus bases de dato y servidores, porque no tenían los medios ni la motivación de hacer lecturas en este universo de información que almacenaban, y porque además guardar esta información tenía un costo elevadísimo debido las bajas capacidades de almacenamiento disponibles hace 10 años, hablamos de compañías como Cisco Systems, AOL, Movistar y muchas otras.

Desde el año 2001, muchas empresas han visto el potencial que el Big Data ofrece y se han decidido a explorar este mar de información para averiguar sobre los gustos, preferencias y comportamiento de los consumidores (como un inicio).

 

Big Data, la nueva fiebre del oro de la información

A medida que la ley de Moore prueba ser cierta y se reducen los costos de almacenamiento de información, muchas startups han comenzado a generar modelos de datos en base al Big Data para vendérselos luego a grandes empresas, de esta manera pueden crear productos y servicios hechos a medida para resolver las necesidades reales de los clientes, y también detectar a través de patrones de comportamiento oportunidades de negocio, a esto se enfocan principalmente los bancos y tiendas de retail que dicen extraer valor de los datos para conocer a sus clientes.

Nuestros datos se han convertido ahora más que nunca en oro sólido, el volumen de información que está a la venta sobre cada aspecto de nuestras vidas han convertido a esa secuencia de ceros y unos en un commodity digital.

Aunque aún no se dictan leyes  sobre el uso del Big Data a nivel mundial, mi impresión es que las empresas que hagan uso de esta información, más que privilegiada para fines comerciales, deban pagar derechos en forma de royalty por el acceso a nuestra información. Estamos hablando que las compañías a quienes les compramos productos para cada etapa de nuestras vidas, llevan una ventaja incomparable a la hora de vendernos estilos de vida y crear necesidades, es como jugar una mano de poker contra alguien que tiene escalera real, simplemente no vas a ganar. Existe un vacío legal principalmente porque aún nos dimensionan las consecuencias y el alcance real que el Big Data puede tener sobre los mercados globales y el poder casi absoluto que puede poner en manos de las multinacionales.

 

gold-rush

Big Data en números

En un futuro cercano todos nuestros aparatos electrónicos, coches, bicicletas, hogares e incluso nuestros cuerpos generarán datos e información las 24 horas. Se calcula que la suma total  de datos de información en bytes, que han sido procesados y almacenados en ordenadores en los últimos dos años, osea desde 2014 a 2016 es igual a todos los datos procesados por la humanidad en los últimos 300 años. Estamos hablando que en 730 días y 12 horas se han recogidos y procesado más datos, que todo el Raw Data generado por todos los satélites puestos en órbita, programas espaciales, datos de guerra electrónica, universidades, escuelas públicas y ordenadores industriales en el siglo XX. La información generada solamente por smartphones en un solo día es de 2.5quintillones de bytes.

Se estima que para el año 2020, los volúmenes de datos generados en bytes de información serán de alrededor de 40 Zettabytes,  esto viene a ser un número estimado a todos los granos de arena de las playas del mundo multiplicado por 75. (fuente. Documental Big Data Science)

Back to the basics

1 bit = 0,1 .  Secuencia mínima del código binario.

1 byte = 8 bits.  Es el unidad mínima de la arquitectura de los ordenadores y son una secuencia 8 bits.

Ahora

40 Zettabytes = 40 000 000 000 000 000 000 000

 

Marcas y Big Data

Macy’s

Es una de las empresas más antiguas de retail en Estados Unidos, y gracias a la implementación de la herramienta de Big Data a la analítica de la compañía, han mejorado la experiencia de compra de sus clientes. Gracias a esta plataforma analítica, han logrado modificar los precios de su página web en tiempo real según los intereses de sus compradores finales, ya que ahora el proceso de análisis del data les brinda un máximo nivel de detalle acerca de sus clientes y la manera en que piensan, saben por ejemplo  qué categorías y aplicaciones son las que más utilizan de su web, cuáles son lo productos que más compran, que ofertas tienen más conversiones y en qué momento del día y del mes son más propensos a comprar. Para hablar de números Macy’s ha logrado ahorrar más de 500.000 dólares anuales, han incrementado las suscripciones a la newsletter y la taza de conversión ha aumentado considerablemente, incluso las ventas en la tienda física han aumentado en un 10%.

Barak Obama 

Para su segundo mandato Barry O (como se le conoce en Washington al Presidente Obama) utilizó el Big Data, para elaborar informes precisos sobre la maza votante de su país, y pudo saber con certeza datos como: cuántas personas que recibían volantes en la calle terminaba dándose de alta en el registro electoral, pudo saber a fondo que temas les interesaba al electorado, cuál era la mejor manera de dirigirse a ellos en términos  y conceptos para así persuadir a los votantes indecisos. Sí, aunque te parezca que lo viste en la última temporada de House of cards, Obama lo hizo en el 2012.

Esta estrategia tuvo un éxito rotundo, ya que gracias a la implementación del Big Data en la propaganda electoral, pudieron destinar los recursos de la campaña en los canales adecuados, la mayoría de esto se enfocó en la comunicación, las RRSS y blogs. El resultado inmediato, fue que la gente se sintío más cerca del candidato ya que lo percibían cercano a sus problemas, y así pudo segmentar por temáticas las necesidades de cada estado para atacarlas individualmente.

Esto no es nada nuevo, en política se hacía siempre mediante a encuestas, pero con el Big data el volumen de datos era tal, que se pudo llegar a un nivel de segmentación de perfiles electorales nunca antes visto. Gracias al Big Data Obama fue reelegido en las elecciones del 2012.

 

obama

Predict stuff  “YES WE CAN”

 

Google y el Big Data

Si hay alguien que sabe de Big Data es Google. Cuando nosotros hacemos búsquedas por medio de este search engine, pensamos que es una magna contribución a nuestra curiosidad, pero la verdad es que nuestra interacción con Google es una mutua retroalimentación de información, al ingresar los términos de búsqueda en la página, accionamos resultados de acuerdo a las palabras claves que se encuentran en su índice, Google sabe por nuestra IP en que lugar del planeta nos encontramos, y puede ver patrones de búsqueda en ciertas palabras claves en un lugar y tiempo determinado. Por ejemplo si se realizan muchas búsquedas con el término ” síntomas de la gripe” en Catalunya en el mes de noviembre, Google entiende que quizá un brote de gripe se esté gestando en esa región.

Google ofrece desde hace años y de forma gratuita Google trends, que es una herramienta que brinda una visión general de los volúmenes de búsqueda de palabras claves por países o ciudades en un tiempo determinado, ahora esto es lo que está disponible al público, pero podéis imaginaros realmente la precisión de las predicciones que Google puede hacer desde sus bases de datos.

Pero esto no es todo, a un nivel más personal, si utilizas un móvil con sistema Android, probablemente tu perfil de usuario o Google ID te acompaña a todos lados y como la locación por GPS viene conectada por defecto, Google sabe en todo minuto donde estás y que haces. Los smartphones tienen sensores de movimiento incorporados, si tu teléfono permanece quieto de noche por más de 4 horas, Google entiende que estás dormido y comienza a procesar datos de cuantas horas duermes a la semana, sabe que lees en tu móvil mientras estás en el baño y cuanto tiempo te toma, también a que hora te despiertas y que es lo primero que haces al despertar, si has dormido poco, puede sugerirte casualmente leer un libro de noche y si estás de mal humor ir al cine a ver una película. Al estar conectado con Gmail, sabe perfectamente que mails son los primeros qué lees y respondes, cuales son tus búsquedas en el móvil, dónde planeas ir de vacaciones, que reuniones tienes planificadas y con quién quedarás para unas cañas después del curro.

Hace algunos años Google lanzó una herramienta de analítica llamada BigQuery, que es un SQL que te permite hacer búsquedas de información precisas y casi en tiempo real, en volúmenes grandes de datos con billones de filas de código. Esta herramienta fue diseñada para analistas y desarrolladores. Hace consultas en lenguaje SQL en millones de terabytes de código en fracciones de segundo. Ahora tiene un coste un poco elevado y la interfaz no es muy amigable, pero los ingenieros en California ya están trabajando en ello.

 

Tipos de DATOS en Big Data

 

Machine to Machine

La máquinas inteligentes como ascensores, wearables y equipos médicos se conectan con sus bases centrales, segundo a segundo las máquinas intercambian información. Esta es la data dura del Big Data y lo hacen por medio del Wi-Fi, Bluetooth, lásers y sensores. En este punto el Big Data se enlaza con con el IOT y en esta categoría entran también las nano máquinas y la exploración espacial.

RRSS

Cada interacción y hit que generamos en las redes sociales ya sean, etiquetas,  me gusta, + 1 y retweets que damos, son datos que se analizan mediante algoritmos propios de cada RRSS.  Diariamente se envían alrededor de 200 millones de e-mails y se envían 13.000 tweets por segundo.

Intercambio de datos

Internet y los aparatos móviles se utilizan a diario para realizar transacciones, facturaciones, llamadas y consultas, todos estos dispositivos están conectados a una red con una IP. Las páginas web son descargadas  desde un servidor que guarda la información sobre los equipos que realizan esta petición, esta Raw Data representa el mayor volumen de datos y los más fiables que se pueden obtener.

UX y Analítica web

Los movimientos que realizamos con el mouse, el contenido que buscamos en la web, el tiempo que pasamos en un sitio, los clics que realizamos, los mapas de calor que generamos y la experiencia del usuario son datos muy importantes para desarrolladores y compañías de Marketing Online.

Biométrica

Estos datos sin duda son de los más interesantes de analizar y representan un beneficio para la humanidad, a través de wearables y otros aparatos se puede monitorizar el cuerpo humano en tiempo real, este sin duda es el futuro de la ciencia, en dónde quizá en los próximos años nos llegará un correo advirtiéndonos que podemos beber sólo 2 cañas de cerveza o que es momento de ir al doctor por que tu hígado está por fallar.

 

 

El Big Data, es sin duda una ventana a todos los datos de nuestras vidas, es una herramienta de analítica inigualable que nos da la oportunidad de optimizar nuestros procesos y ofrece muchos beneficios para la ciencia y el desarrollo de nuestra civilización. Pero también representa un peligro inminente en las manos equivocadas, sí hay una premisa que ha probado ser válida en nuestros días es: ” la información es poder” ergo “información absoluta, poder absoluto”.

 

 

 

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *