OpenWebinars

Curso de Procesamiento de datos semi-estructurados con AWS S3, AWS RedShift y AWS Glue

Aprende a realizar el procesamiento de datos semi-estructurados almacenados en AWS S3 utilizando AWS Glue y AWS Redshift, y su visualización utilizando AWS QuickSight.

4.4(40 valoraciones)

Icono de la tecnología

La metodología y plataforma de formación que se adapta al tamaño y ritmo de tu empresa.

Cuéntanos tu caso

Curso impartido por

Avatar:Valery Calderón Briz

Valery Calderón Briz

Experta Data Engineer

Contenido de la formación

5 Secciones · 15 Lecciones · 1 h. y 14 min. en total

Introducción

2 min.

AWS Glue: Conceptos

23 min.

Creando un Data Pipeline con AWS Glue

30 min.

Explorando el dataset en Redshift

14 min.

Conclusiones

2 min.

Habilidades que obtendrás

  • Crear un catálogo en AWS Glue.
  • Convertir archivos JSON en tablas de AWS Redshift.
  • Explorar las colecciones de datos en con Queries de SQL.
  • Implementar un flujo automatizado de ingesta de datos.
  • Visualizar los datos en un tablero con gráficas de QuickSight.

Requisitos mínimos

Es necesario tener conocimientos sobre los conceptos de Data Lakes, Data Warehouse y AWS S3 básico.
 

Valoración de nuestros alumnos

4.4
40 valoraciones
  • 5
  • 4
  • 3
  • 2
  • 1

Completa tu formación con estos contenidos

Icono de la tecnología
Laboratorio

Contenedores serverless con AWS App Runner

Intermedio
1 h. y 27 min.

Fórmate con este Laboratorio para aprender a desplegar tus aplicaciones basadas en contenedores sin la complejidad asociada a...

Javier Moreno
4.7

Preguntas frecuentes

Resuelve tus dudas o contacta con nosotros para más información.

Cuéntanos tu caso
Efectivamente, una vez superada cada formación, podrás descargarte el diploma acreditativo de cada una de ellas. Añádelas a tu CV y mejora tu perfil para las empresas. También podrás obtener un diploma de nivel superior al superar todas las formaciones de la ruta.

En OpenWebinars las formaciones no tienen fecha de inicio y de final.

Cada curso tiene una fecha de publicación y desde ese día estarán 100% disponible todos los contenidos del curso para los usuarios suscritos a alguno de nuestros planes.

En OpenWebinars no vendemos formaciones.

Tenemos diferentes tipos de suscripciones, que te dará acceso completo a todas las formaciones de la plataforma y a las nuevas que vamos lanzando, siempre y cuando tu suscripción esté activa (como Spotify con la música o Netflix con las películas y series).

¿Eres una empresa? Tenemos planes especiales para ti. Consúltanos aquí.

Este curso está dirigido a perfiles de desarrollo de software con conocimientos previos intermedios o avanzados en procesamiento de datos, además de a perfiles intermedios y avanzados en ingeniería de datos o ciencia de datos que quieren automatizar procesos utilizando las herramientas de la nube de AWS.

Para poder seguirla de forma adecuada es necesario tener conocimientos a nivel intermedio de la consola de AWS, además de conocimientos intermedios-avanzados tanto sobre bases de datos y SQL, como sobre los conceptos de flujos de datos en Data Lake y Data Warehouse.

En esta formación aprenderás a procesar datos semi-estructurados que se ha almacenado previamente en AWS S3, utilizando para ello AWS Glue para transformar y dar estructura a estos datos, insertarlos posteriormente a un Data Warehouse montado sobre AWS Redshift y, finalmente, visualizarlos de en gráficos de AWS QuickSight.

En el primero de los apartados en los que se divide este curso, se hará una completa introducción del servicio AWS Glue y Glue Catalog, explicando qué son estos servicios y para qué sirven, además de aprender a crear eventos de AWS S3. También veremos en esta primera parte con la explicación sobre qué es AWS Redshift y cómo es su arquitectura. Se completa el bloque con un test de autoevaluación para poner a prueba los conocimientos adquiridos.

El segundo apartado formativo está centrado en la creación de un Data Pipeline con AWS Glue, detallando todas sus fases, desde la creación de un clúster Redshift y su IAM, hasta la creación de un Glue Job, la exploración con Glue Job Studio y su monitorización posterior. Al final encontrarás otro test de autoevaluación para chequear tu aprendizaje.

Para concluir el curso, aprenderás a explorar el dataset resultante desde la interfaz gráfica de Redshift a lo largo de dos lecciones. En la primera se hará la exploración de los datos dentro de Redshift, y en la segunda se conectará el trigger de S3 al Glue Job. De nuevo, como cierre del apartado, podrás hacer el correspondiente test para autoevaluar los conocimientos adquiridos.