A diario escuchamos hablar mucho sobre Big Data, un término, quizás un poco ambiguo.

Apache Hadoop fue creado para realizar Big Data por lo que vamos a intentar definir el término antes de comenzar.

Definición: Conseguir llevar a cabo el procesamiento de grandes cantidades de datos muy diversos en un tiempo aceptable.

En el ámbito del Big Data, es muy habitual escuchar acerca de las 4 V’s. Las 4 V’s del Big Data son:

  • Volumen: Grandes cantidades de datos
  • Variedad: Ser capaces de trabajar con tipos de datos muy diversos.
  • Velocidad: Se refiere al tiempo utilizado en la ingesta, transformación y utilización de estos datos.
  • Valor: Transformar los datos en información útil.
Imagen 0 en Video: Qué es Big Data.

Podemos añadir una quinta V:

  • Veracidad: Como de fiable es la información recibida.

Definiciones a parte, lo que no podemos negar es el crecimiento que se está produciendo en la información que se genera a diario. A día de hoy se almacena cualquier dato bruto para intentar convertirlo en información útil. Es aquí donde nace Apache Hadoop.