Las cookies nos permiten ofrecer nuestros servicios. Al utilizar nuestros servicios, aceptas el uso que hacemos de las cookies. Más Información. Aceptar

¿Qué es y cómo usar Pentaho Data Integration? - Tutorial en español

Juan  Luis Montoya Marchena
  • Escrito por Juan Luis Montoya Marchena el 15 de Noviembre de 2019
  • 1 min de lectura Big Data
¿Qué es y cómo usar Pentaho Data Integration? - Tutorial en español

Pentaho Data Integration, como las demás herramientas de Pentaho CE, está basada en Java, lo que va a permitir que sea multiplataforma y esté desarrollada en un lenguaje mucho más extendido y conocido.

También es Open Source, por lo que contamos con una amplia comunidad, como ya vimos en el video anterior.

Tiene una interfaz Drag&Drop, mediante la cual podemos arrastrar las tareas, de una forma sencilla y simple, y conectarlas para dirigir el flujo de datos. De esta forma, siempre vamos a tener una vista general de cómo fluyen los datos y qué lógica se les aplica a esos datos.

Es compatible con multitud de orígenes, por lo tanto, podremos conectarlo tanto a una base de datos, sea del tipo que sea, a un fichero de texto, a un documento Excel o a cualquier tipo de origen desde el que podamos leer.

También es compatible con aplicaciones de terceros de tipo Big Data, como puede ser Hadoop o Spark.

Interfaz de Pentaho Data Integration

Vamos a echar un vistazo a la interfaz del programa.

Interfaz de Pentaho Data Integration

Como vemos en la imagen, contamos con una amplia área dónde podemos arrastrar los diferentes Steps, que contienen las tareas específicas a tratar en los datos, y están categorizadas por el tipo.

Por ejemplo, podemos coger una tarea de entrada, como puede ser una tabla de base de datos, después podemos aplicarle algún tipo de lógica, como puede ser un filtro (Flow) para filtrar filas.

Aplicando un filtro a una tabla de bases de datos

A continuación, para conectar estos dos elementos, hacemos click en el icono de conexión del primer elemento, y arrastramos la flecha al siguiente elemento.

Conexión de dos elementos

De esta forma, las filas que nos generen esta entrada de tabla, pasarán al filtro que hemos seleccionado.

Cada paso tiene una configuración en concreto. En este caso, la entrada de tabla tiene para especificar la consulta y una conexión.

Configuración de entrada de tabla

Y el filtro, nos va a permitir filtrar los flujos de datos por algún campo específico, y mandar, en caso de verdadero o falso, a un paso u otro.

Filtrando flujos de datos

Relacionado

Te dejamos una selección de cursos, carreras y artículos

Ventajas e inconvenientes de Pentaho CE

Ventajas e inconvenientes de Pentaho CE

Big Data

17 de Noviembre de 2019

Si estás valorando comenzar a utilizar Pentaho CE, te contamos todas la ventajas que ofrece la plataforma, y también te explicamos algunos de los inconveniente que presenta.

Curso de Power BI: Introducción

Curso de Power BI: Introducción

curso

Con este curso aprenderás:

  • Instalar y configurar Power BI y su aplicación de escritorio, Power BI Desktop.
  • Generar reportes de forma sencilla.
  • Crear gráficas y visualizaciones.

Duración: 2 horas y 19 segundos

Curso de Pentaho para principiantes

Curso de Pentaho para principiantes

curso

Con este curso aprenderás:

  • Aprenderás a modelar una BBDD PostgreSQl orientada a un BI.
  • Sabrás preparar tu entorno e instalar el servidor Pentaho CE.
  • Tendrás soltura a la hora de manejar el portal de Pentaho.

Duración: 3 horas y 17 minutos

Más de 300 empresas confían en nosotros

Oesia
Vass
Everis
Ayesa
Altran
Ibermatica
Atmira
GFI
Accenture
GMV
Concatel
Telefonica
Caser
Banco de España
kpmg
Mapfre
Randstad