Curso de Procesamiento de datos semi-estructurados con AWS S3, AWS RedShift y AWS Glue

Aprende a realizar el procesamiento de datos semi-estructurados almacenados en AWS S3 utilizando AWS Glue y AWS Redshift, y su visualización utilizando AWS QuickSight.

103 Alumnos matriculados

4.3(41 valoraciones)

La metodología y plataforma de formación que se adapta al tamaño y ritmo de tu empresa.

+1750 formaciones en constante actualización
Masterclasses en vivo con profesionales destacados
155 rutas de aprendizaje para guiarte

Cuéntanos tu caso

Curso impartido por

Valery Calderón Briz

Experta Data Engineer

Saber más

Contenido de la formación

5 Secciones · 15 Lecciones · 1 h. y 14 min. en total

Introducción

2 min.

AWS Glue: Conceptos

23 min.

Creando un Data Pipeline con AWS Glue

30 min.

Explorando el dataset en Redshift

14 min.

Conclusiones

2 min.

Habilidades que obtendrás

Crear un catálogo en AWS Glue.
Convertir archivos JSON en tablas de AWS Redshift.
Explorar las colecciones de datos en con Queries de SQL.
Implementar un flujo automatizado de ingesta de datos.
Visualizar los datos en un tablero con gráficas de QuickSight.

Requisitos mínimos

Es necesario tener conocimientos sobre los conceptos de Data Lakes, Data Warehouse y AWS S3 básico.

Valoración de nuestros alumnos

4.3

41 valoraciones

Completa tu formación con estos contenidos

Curso

Implementar una Data Pipeline con AWS EMR y PySpark

Avanzado

1 h. y 41 min.

En esta formación exploramos los conceptos de la ejecución de cargas de trabajo en un clúster de EMR...

Valery Calderón Briz

4.1

Curso

Configurar y usar AWS Redshift como DataWarehouse

Avanzado

1 h. y 17 min.

En esta formación se aprenderá a montar un Data Warehouse en AWS Redshift, optimizar tanto sus clúster como...

Valery Calderón Briz

4.5

Curso

Contenedores serverless con AWS App Runner

Intermedio

1 h. y 27 min.

Fórmate con este Laboratorio para aprender a desplegar tus aplicaciones basadas en contenedores sin la complejidad asociada a...

Javier Moreno

4.8

Preguntas frecuentes

Resuelve tus dudas o contacta con nosotros para más información.

Cuéntanos tu caso

Efectivamente, una vez superada cada formación, podrás descargarte el diploma acreditativo de cada una de ellas. Añádelas a tu CV y mejora tu perfil para las empresas. También podrás obtener un diploma de nivel superior al superar todas las formaciones de la ruta.

En OpenWebinars las formaciones no tienen fecha de inicio y de final.

Cada curso tiene una fecha de publicación y desde ese día estarán 100% disponible todos los contenidos del curso para los usuarios suscritos a alguno de nuestros planes.

En OpenWebinars no vendemos formaciones.

Tenemos diferentes tipos de suscripciones, que te dará acceso completo a todas las formaciones de la plataforma y a las nuevas que vamos lanzando, siempre y cuando tu suscripción esté activa (como Spotify con la música o Netflix con las películas y series).

¿Eres una empresa? Tenemos planes especiales para ti. Consúltanos aquí.

Este curso está dirigido a perfiles de desarrollo de software con conocimientos previos intermedios o avanzados en procesamiento de datos, además de a perfiles intermedios y avanzados en ingeniería de datos o ciencia de datos que quieren automatizar procesos utilizando las herramientas de la nube de AWS.

Para poder seguirla de forma adecuada es necesario tener conocimientos a nivel intermedio de la consola de AWS, además de conocimientos intermedios-avanzados tanto sobre bases de datos y SQL, como sobre los conceptos de flujos de datos en Data Lake y Data Warehouse.

En esta formación aprenderás a procesar datos semi-estructurados que se ha almacenado previamente en AWS S3, utilizando para ello AWS Glue para transformar y dar estructura a estos datos, insertarlos posteriormente a un Data Warehouse montado sobre AWS Redshift y, finalmente, visualizarlos de en gráficos de AWS QuickSight.

En el primero de los apartados en los que se divide este curso, se hará una completa introducción del servicio AWS Glue y Glue Catalog, explicando qué son estos servicios y para qué sirven, además de aprender a crear eventos de AWS S3. También veremos en esta primera parte con la explicación sobre qué es AWS Redshift y cómo es su arquitectura. Se completa el bloque con un test de autoevaluación para poner a prueba los conocimientos adquiridos.

El segundo apartado formativo está centrado en la creación de un Data Pipeline con AWS Glue, detallando todas sus fases, desde la creación de un clúster Redshift y su IAM, hasta la creación de un Glue Job, la exploración con Glue Job Studio y su monitorización posterior. Al final encontrarás otro test de autoevaluación para chequear tu aprendizaje.

Para concluir el curso, aprenderás a explorar el dataset resultante desde la interfaz gráfica de Redshift a lo largo de dos lecciones. En la primera se hará la exploración de los datos dentro de Redshift, y en la segunda se conectará el trigger de S3 al Glue Job. De nuevo, como cierre del apartado, podrás hacer el correspondiente test para autoevaluar los conocimientos adquiridos.

Curso de Procesamiento de datos semi-estructurados con AWS S3, AWS RedShift y AWS Glue

Curso impartido por

Valery Calderón Briz

Contenido de la formación

Introducción

AWS Glue: Conceptos

Creando un Data Pipeline con AWS Glue

Explorando el dataset en Redshift

Conclusiones

Habilidades que obtendrás

Requisitos mínimos

Valoración de nuestros alumnos

Completa tu formación con estos contenidos

Implementar una Data Pipeline con AWS EMR y PySpark

Configurar y usar AWS Redshift como DataWarehouse

Contenedores serverless con AWS App Runner

Preguntas frecuentes

¿Puedo obtener un diploma que acredite mis conocimientos?

¿Cuándo comienza la formación?

¿Cuál es el precio?