¿Qué es eso del “big data”?

Aunque, como casi todo en este mundo de la tecnología, esto es algo que viene de hace tiempo, parece que en los últimos meses el término “big data” ocupa cada vez más un lugar destacado entre los “términos de moda”.
Bien, ¿y qué es eso del “big data” que tanto se escucha? El término “big data” se usa generalmente para referirse a grandes cantidades de datos no estructurados o semi-estructurados. Y que, por su tamaño, el esfuerzo de incorporarlos a una base de datos relacional supondría demasiado coste. Otra definición más clara aún: hablamos de “big data cuando el tamaño de los datos se convierte en parte del problema”. O, como dice Edd Dumbill, “cuando los datos son lo suficientemente grandes como para poder ser procesados con métodos tradicionales”. Cuando en este contexto se habla de “grandes volúmenes de datos” no existe una cantidad específica sobre la cual se pueda empezar a hablar de “big data”, aunque el término se utiliza normalmente cuando estamos ante petabytes o exabytes.
Tomando una definición de IBM, normalmente el “big data” se estudia principalmente desde tres dimensiones: volumen (hablamos de grandes volúmenes de datos, petabytes o más), velocidad (deben ser recuperados rápidamente) y variedad (vienen de diversas fuentes, estructuradas y no estructuradas).
Hay que tener en cuenta que esto del “big data” es un tema que la tecnología aún no tiene resuelto del todo, y que aun se encuentra en investigación. Los principales restos sobre los que se está investigando suelen estar relacionados con problemas tales como trabajar con fuentes de datos heterogéneas e inconcurrentes, con datos no estructurados, escalabilidad, combinar los beneficios los RDBMS (los sistemas relacionales) y de las BBDD NoSQL, optimización de consultas, etc.
Si quieres seguir con el tema, te dejo y recomiendo este artículo que Adam Jacobs publicó en Comunications of ACM: The Pathologies of Big Data.
Estamos en contacto! Aquí o en twitter (@jgarzas)

0 comentarios en “¿Qué es eso del “big data”?”

  1. Pingback: Bitacoras.com

  2. Pingback: Resumen de la semana – del 12 al 18 de Marzo de 2012 - Javier Garzás, sobre calidad software y otros temas relacionados

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Share This
Ir arriba