OpenWebinars

Big Data

Pentaho Data Integration desatendido y control de errores

En esta ocasión nos centramos en otra de las herramientas de la suite de Pentaho, como es Data Integration, de la que te explicamos en qué consiste y qué es lo que nos ofrece.

Juan Luis Montoya Marchena

Juan Luis Montoya Marchena

EXPERTO EN PENTAHO

Lectura 1 minutos

Publicado el 20 de febrero de 2020

Compartir

    Tabla de contenidos

Aprende las técnicas más avanzadas en análisis de datos
Comienza 15 días gratis en OpenWebinars y accede a cursos, talleres y laboratorios prácticos de Hadoop, Spark, Power BI, Pandas, R y más.
Registrarme ahora

Qué es Pentaho Data Integration

Pentaho Data Integration es la herramienta para crear procesos ETL, es decir, procesos de extracción, transformación y carga, que nos ofrece la suite fin de Pentaho. Es también un programa externo, programado en Java, y con una interfaz, como las demás herramientas de la suite, bastante intuitiva.

Nos ofrece una gran variedad de orígenes de datos, como pueden ser bases de datos, consultas MDX, Excel, CSV y cualquier otro origen que se nos ocurra, lo podremos encontrar en esta herramienta.

Nos proporciona una gran variedad de pasos o de operaciones en concreto que podemos aplicar nuestro flujo de datos, como pueden ser filtros, lógica avanzada de JavaScript, agrupaciones, ordenaciones, etcétera.

También permite configurar los avisos por correo, por si un proceso termina y queremos recibir un aviso, o por si ocurre algún error y queremos que se notifique por correo, podremos configurarlo directamente en esta herramienta.

Con ella tendremos el control de errores, lo que nos va a facilitar que cuando haya algún dato que no está en la forma que esperamos, poder sacarlo del flujo, no interrumpir el proceso, que no termine en error y poder terminar. También permite poder informar por correo de este tipo de errores y la causa por la que ha ocurrido.

También nos permite poder programar sus lanzamientos, ya sea desde consola o del propio Pentaho Server, y tener un control jerárquico de esos procesos, ya que tenemos dos tipos de estructuras, que unas engloban a las otras, como son los Jobs y las transformaciones.

Como cada una de estas estructuras tiene un objetivo en concreto, Pentaho Data Integration nos va a permitir tener una estructuración y una mejor jerarquización de nuestros procesos ETL, así como un mejor control del flujo.

Analiza los datos para tomar mejores decisiones en tu empresa
Cursos y talleres para formar a tus científicos de datos e ingenieros en las herramientas más utilizadas: Hadoop, Spark, Power BI, Pandas, R y más.
Solicitar más información
Compartir este post

También te puede interesar

Icono de la tecnología
Empresas

Curso de Pentaho intermedio

Intermedio
5 h. y 7 min.

Este curso de Pentaho intermedio te permitirá completar la formación comenzada en el curso inicial sobre esta potente...

Juan Luis Montoya Marchena
4.2
Icono de la tecnología
Empresas

Curso de Pentaho para principiantes

Principiante
3 h. y 17 min.

Realizando este curso de Pentaho para principiantes serás capaz de comenzar a utilizar todo el potencial de la...

Juan Luis Montoya Marchena
4.1