Big Data

Qué es Pentaho BI y qué módulos lo componen

En esta ocasión vamos a profundizar en Pentaho BI, explicando qué es, sus características, de qué módulos se compone, sus novedades y por qué utilizarlo.

Publicado el 20 de Diciembre de 2021
Compartir

La selección de una plataforma de Business Intelligence va a depender de varios factores tales como el precio, el soporte del vendedor, la facilidad de configurar y administrar los módulos, la flexibilidad para integrarse con múltiples infraestructuras y aplicaciones, la simplicidad de la interfaz de usuario, las ventajas sobre otras plataformas, entre muchos más.

Tomar una decisión de este tipo, no es algo que se tome a la ligera y supone un gran reto para las organizaciones. Para simplificar y acelerar este proceso, anualmente, varias consultoras reconocidas realizan estudios acerca de la experiencia de los usuarios con diferentes plataformas, luego analizan los resultados y preparan informes y publicaciones que podemos indagar a fin de conocer cuáles son aquellas plataformas con mejor puntación en los ratings elaborados según las clasificaciones.

Dentro de la clasificación para Data Integration Tools (Herramientas de Integración de Datos), encontramos la suite de Pentaho de Hitachi Vantara.

Qué es Pentaho BI

La plataforma Pentaho BI es un conjunto de soluciones para el análisis e inteligencia de negocios que incorpora diferentes componentes web y módulos para la gestión integral de los datos, sin necesidad de que el usuario final tenga experiencia previa en codificación. Esta plataforma es open source y puede ser implementada en un ecosistema local, en el cloud o mixto (un modelo híbrido).

Las soluciones de Pentaho BI sirven para optimizar la integración de datos, la creación de informes y cuadros de mando con visualizaciones interactivas de los datos, y el descubrimiento de respuestas mediante el análisis predictivo.

En los últimos años, Pentaho ha mejorado sus componentes para obtener mayor adaptabilidad a los cambios tecnológicos y permitir que sean compatibles con tecnologías del entorno de Big Data (ABDL: Adaptive Big Data Layer), IOT y Machine Learning. Adicional, admite un extenso número de orígenes de datos, tipos de archivos, aplicaciones analíticas de terceros, bases de datos NoSQL, distribuciones de Hadoop, entre otras herramientas.

Todo lo anterior, posiciona a Pentaho BI como un fuerte competidor en el sector para las empresas que busquen evolucionar sus ecosistemas de información. Pentaho ofrece una versión de prueba gratuita por 30 días, pasados los cuales, será necesario contactar a su departamento de ventas para obtener la versión enterprise.

Características de Pentaho

Pentaho BI tiene varias características claves para los clientes, tales como:

  • Amplia gama de funcionalidades ETL que admite metadatos de múltiples formatos y orígenes de datos de repositorios de Big Data.
  • Capacidades analíticas avanzadas para la gestión de modelos multidimensionales.
  • Herramientas desarrolladas para adaptarse a varios ecosistemas con capacidad de evolucionar y abstraerse a los cambios.
  • Una intuitiva y completa interfaz gráfica de diseño para generar informes interactivos detallados con sub-informes y visualizaciones adicionales.
  • Una comunidad online para Pentaho que presta soporte técnico.
  • Un motor de consultas optimizado para mejorar el rendimiento de los informes y el tiempo de ejecución.

Adicional, Pentaho BI se caracteriza por los siguientes componentes:

  • Analysis (Análisis): El análisis predictivo de los datos (Big Data) se habilita mediante los informes de Pentaho en varias formas, como cuadros de mando, widgets, tablas dinámicas, etc.
  • Data Integration (Integración de datos): Está compuesto de recursos para la integración y transformación de los datos y la gestión de datos de Hadoop.
  • Data Mining (Procesamiento de datos): Consiste en la interacción con los datos para identificar grupos o patrones y generar predicciones para futuros análisis respaldados por algoritmos de Machine Learning.
  • Dashboards (Tableros): Pentaho provee un panel gráfico de autoservicio con plantillas y opciones para la personalización del diseño de los cuadros de mando y visualizaciones.
  • Reporting (Informes): Facilita la creación de informes y su exportación en formatos tradicionales como PDF, XLS, TXT, etc.
Imagen 0 en Qué es Pentaho BI y qué módulos lo componen

Módulos de Pentaho BI

Pentaho BI dispone de módulos de diseño desarrollados para perfeccionar el flujo de modelado, transformación, almacenamiento y visualización de datos. A continuación, se detalla cada uno:

  1. Aggregation Designer (Diseñador de agregaciones). Dispone de una interfaz para optimizar el rendimiento de las consultas de cubos OLAP, permitiendo la creación de nuevas tablas agregadas dentro de las dimensiones seleccionadas. Ayuda a obtener datos pre-calculados sobre los archivos de esquema de Pentaho Analysis (Mondrian) en XML mejorando el rendimiento de los análisis.

  2. Data Integration (Integrador de datos). Cuenta con un motor ETL (extracción, transformación y carga) y una interfaz de usuario que le permite la gestión y desarrollo de los flujos de la integración de datos, es decir, la recopilación de estos, la depuración y/o transformación, y la posterior conservación en un formato apropiado y accesible para el usuario y otras aplicaciones. Este módulo también es llamado “Kettle” actualmente. Posee la capacidad de gestionar diferentes almacenes de Big Data en clústeres distribuidos en la nube.

  3. Metadata Editor (Editor de metadatos). Dispone de un editor de metadatos útil para personalizar la capa de metadatos modelando la estructura de la base de datos para generar un modelo lógico de metadatos. Luego el módulo de Informes interactivos de Pentaho utilizará el modelo resultante para crear informes dentro del servidor Business Analytics (BA) sin requerir de otras aplicaciones externas.

  4. Report Designer (Diseñador de informes). Ofrece una interfaz de usuario con opciones de diseño que facilitan la preparación de informes de buena calidad con visualizaciones muy detalladas que pueden contener una variedad de gráficos e incluso sub-informes. Su motor de informes trabaja con una plantilla en formato ZIP que consta de recursos XML para definir el estilo del informe.

  5. Schema Workbench (Desarrollador de esquemas). Cuenta con una interfaz de usuario y elementos para la creación y edición de modelos multidimensionales (MDX - multi-dimensional expressions) de forma gráfica o manual.

  6. Design Studio (Estudio de Diseño). Consiste en una aplicación con complementos basados en Eclipse, que sirve para crear automatizaciones y acciones secuenciales que faciliten la creación de flujos de procesos empresariales orientados a resultados dentro del servidor BA.

Los componentes web de Pentaho son compatibles con la mayoría de los navegadores, conoceremos cuáles son a continuación:

  1. Analizador (Analyzer). Proporciona un conjunto de opciones avanzadas en un visor OLAP intuitivo para profundizar en el almacén de datos (Mondrian), realizar consultas parametrizadas, crear medidas, aplicar filtros y dar formato a los datos, configurar y generar hipervínculos, confeccionar gráficas de varios tipos y diseñar visualizaciones detalladas.

  2. CTools. Proporciona un marco de opciones para desarrollar paneles dinámicos mediante CSS, JavaScript y HTML. Los usuarios tendrán una mayor facilidad para explorar los conjuntos de datos a través de tablas, gráficos, entre otros elementos.

  3. Diseñador de cuadros de mando (Dashboard Designer). Proporciona una serie de contenidos de diseño, temas personalizables y plantillas predeterminadas, que se pueden combinar para que los informes sean atractivos, y ofrezcan información comprensible para el análisis del usuario en un vistazo.

  4. Asistente de fuente de datos (Data Source Wizard). Proporciona asistencia para preparar los modelos de datos (relacionales o multidimensionales) de cada una de las fuentes de datos importadas para los análisis.

  5. Editor de modelos de fuente de datos (Data Source Model Editor). Proporciona opciones para ajustar y optimizar los modelos existentes. Permite la inserción, eliminación y combinación de campos procedentes de diferentes tablas y ubicaciones.

  6. Informes interactivos (Interactive Reports). Proporciona una interfaz de diseño de informes donde el usuario de negocio puede de forma muy simple (con tan solo arrastrar y soltar), insertar múltiples elementos a un informe, trabajar sobre una plantilla o darle el formato deseado, con independencia del apoyo de los desarrolladores de TI.

  7. Consola de usuario (User Console). Proporciona un entorno de diseño con opciones para la administración de la plataforma, la configuración del servidor de Pentaho, y los accesos a los componentes previamente mencionados.

Por otra parte, la consola de administración de Pentaho (PEC - Pentaho Enterprise Console), consiste es una interfaz web para configurar el servidor de integración de datos, administrar las aplicaciones empresariales, aplicar permisos a informes y repositorios. Las aplicaciones del servidor son las siguientes:

  1. Servidor de Business Analytics (BA): Esta basado en Java y ofrece una interfaz web (HTML5) donde el usuario puede crear, administrar y compartir recursos de BI.
  2. Servidor de Data Integration (DI): Es un servidor para la ejecución de flujos ETL y de integración de datos. Permite programar flujos automatizados y almacenar el historial de revisiones y seguridad.

Mejoras de Pentaho

La nueva versión de Pentaho es la 9.2, entre las principales mejoras que brinda tenemos las siguientes:

  • Completa cobertura y soporte a las plataformas de Microsoft Azure Cloud, incluidas Azure SQL Database, Azure Data Lake Storage, Azure Blob Storage y Azure HD Insights.
  • Soporte de datos actualizado para Cloudera Data Platform y HPE Ezmeral Data Fabric (previamente MapR Data Platform) y la administración de múltiples clústeres de Hadoop es más sencilla.
  • Actualizaciones del software para obtener un mayor rendimiento y mejoras del registro para Pentaho Business Analytics, permitiendo monitorear datos confidenciales en el informe.

Por qué usar Pentaho

Pentaho BI es una plataforma de arquitectura y código abierto que permite a las empresas incorporarla en sus ecosistemas sin limitaciones de cómo elijan almacenar los datos. La plataforma posee varios motores centrales que trabajan de forma independiente, soporta un gran volumen de procesamiento de datos y es muy escalable. También ofrece un buen soporte técnico a los clientes y cuenta con una comunidad dedicada.

Pentaho BI está pensado para las empresas que necesitan realizar la integración de sus datos y tener la capacidad de gestionar todo tipo de datos con diversas fuentes, con Pentaho esto es posible gracias a la capa adaptativa de big data.


Compartir este post

También te puede interesar...

Tecnología

Qué es Business Intelligence y cuáles son sus beneficios

30 Noviembre 2020 Ariel Iván Cipolla
Curso de Pentaho intermedio

Curso de Pentaho intermedio

5 horas y 7 minutos · Empresas

Este curso de Pentaho intermedio te permitirá completar la formación comenzada en el curso inicial sobre esta potente herramienta de Business Intelligence.

  • Business Intelligence
Curso de Pentaho para principiantes

Curso de Pentaho para principiantes

3 horas y 17 minutos · Empresas

Realizando este curso de Pentaho para principiantes serás capaz de comenzar a utilizar todo el potencial de la suite Pentaho CE para Business Intelligence.

  • Business Intelligence
Artículos
Ver todos