Pages Menu
Categories Menu

Posted by on Mar 12, 2012 in big data | 0 comments

¿Qué es eso del “big data”?

Aunque, como casi todo en este mundo de la tecnología, esto es algo que viene de hace tiempo, parece que en los últimos meses el término “big data” ocupa cada vez más un lugar destacado entre los “términos de moda”.

Bien, ¿y qué es eso del “big data” que tanto se escucha? El término “big data” se usa generalmente para referirse a grandes cantidades de datos no estructurados o semi-estructurados. Y que, por su tamaño, el esfuerzo de incorporarlos a una base de datos relacional supondría demasiado coste. Otra definición más clara aún: hablamos de “big data cuando el tamaño de los datos se convierte en parte del problema”. O, como dice Edd Dumbill, “cuando los datos son lo suficientemente grandes como para poder ser procesados con métodos tradicionales”. Cuando en este contexto se habla de “grandes volúmenes de datos” no existe una cantidad específica sobre la cual se pueda empezar a hablar de “big data”, aunque el término se utiliza normalmente cuando estamos ante petabytes o exabytes.

Tomando una definición de IBM, normalmente el “big data” se estudia principalmente desde tres dimensiones: volumen (hablamos de grandes volúmenes de datos, petabytes o más), velocidad (deben ser recuperados rápidamente) y variedad (vienen de diversas fuentes, estructuradas y no estructuradas).

Hay que tener en cuenta que esto del “big data” es un tema que la tecnología aún no tiene resuelto del todo, y que aun se encuentra en investigación. Los principales restos sobre los que se está investigando suelen estar relacionados con problemas tales como trabajar con fuentes de datos heterogéneas e inconcurrentes, con datos no estructurados, escalabilidad, combinar los beneficios los RDBMS (los sistemas relacionales) y de las BBDD NoSQL, optimización de consultas, etc.

Si quieres seguir con el tema, te dejo y recomiendo este artículo que Adam Jacobs publicó en Comunications of ACM: The Pathologies of Big Data.

Estamos en contacto! Aquí o en twitter (@jgarzas)

Javier Garzás

Javier Garzás

Ph.D. en informática, Postdoctorado en la Carnegie Mellon (EE.UU) e Ingeniero en Informática.

Primera vez que me tocó hacer una gestión Ágil en una empresa... año 2001. Desde entonces he trabajado en, o para, más de 90. Y he formado a más de 2000 alumnos.

También soy profe de la Universidad Rey Juan Carlos.
Javier Garzás

0 Comments

Trackbacks/Pingbacks

  1. Bitacoras.com - Información Bitacoras.com... Valora en Bitacoras.com: Aunque, como casi todo en este mundo de la tecnología, esto es algo que…
  2. Resumen de la semana – del 12 al 18 de Marzo de 2012 - Javier Garzás, sobre calidad software y otros temas relacionados - [...] La semana comenzó el lunes hablando sobre el big data. El big data es uno de los términos de…

Post a Reply

Tu dirección de correo electrónico no será publicada.

Share This