AWS

Curso de Procesamiento de datos semi-estructurados con AWS S3, AWS RedShift y AWS Glue

Aprende a realizar el procesamiento de datos semi-estructurados almacenados en AWS S3 utilizando AWS Glue y AWS Redshift, y su visualización utilizando AWS QuickSight.
4.1 (15 valoraciones)
1 hora y 14 minutos · Curso
Procesar datos semi-estructurados con AWS S3, AWS RedShift y AWS Glue

Lo que aprenderás en este curso:

  • Crear un catálogo en AWS Glue.
  • Convertir archivos JSON en tablas de AWS Redshift.
  • Explorar las colecciones de datos en con Queries de SQL.
  • Implementar un flujo automatizado de ingesta de datos.
  • Visualizar los datos en un tablero con gráficas de QuickSight.

Requisitos del curso

Es necesario tener conocimientos sobre los conceptos de Data Lakes, Data Warehouse y AWS S3 básico.
 

Valoraciones de estudiantes:

  • 5
  • 4
  • 3
  • 2
  • 1
4.1
15 valoraciones

Contenido del curso:

    • 2m
    • ¿Qué es AWS Glue y Glue Catalog?
      6m
    • Crear eventos de AWS S3
      6m
    • 3m
    • AWS Redshift y su arquitectura
      7m
    • Test autoevaluación
    • Crear un Cluster Redshift y su IAM
      7m
    • Crear un Glue Job
      6m
    • Explorar Glue Job Studio
      11m
    • Monitorizar Glue Jobs
      5m
    • Test autoevaluación
    • Explorar los datos dentro de Redshift
      8m
    • Conectar el Trigger de S3 al Glue Job
      5m
    • Test autoevaluación
    • Conclusiones
      2m
También te puede interesar

Te dejamos una selección de cursos, carreras y artículos

Implementar una Data Pipeline con AWS EMR y PySpark

Curso de Implementación de una Data Pipeline con AWS EMR y PySpark

1 hora y 41 minutos · Curso

En esta formación exploramos los conceptos de la ejecución de cargas de trabajo en un clúster de EMR optimizado y utilizamos PySpark para realizar las …

  • AWS
Configurar y usar AWS Redshift como DataWarehouse

Curso de Configuración y uso de AWS Redshift como DataWarehouse

1 hora y 17 minutos · Curso

En esta formación se aprenderá a montar un Data Warehouse en AWS Redshift, optimizar tanto sus clúster como las queries que se utilizan y finalmente …

  • AWS

Dudas frecuentes

1

¿Cuál es el precio?

En OpenWebinars no vendemos formaciones.

Tenemos diferentes tipos de suscripciones, que te dará acceso completo a todas las formaciones de la plataforma y a las nuevas que vamos lanzando, siempre y cuando tu suscripción esté activa (como Spotify con la música o Netflix con las películas y series).

¿Eres una empresa? Tenemos planes especiales para ti. Consúltanos aquí.

2

¿Cuándo comienza la formación?

En OpenWebinars las formaciones no tienen fecha de inicio y de final.

Cada curso tiene una fecha de publicación y desde ese día estarán 100% disponible todos los contenidos del curso para los usuarios suscritos a alguno de nuestros planes.

3

¿Puedo obtener un diploma que acredite mis conocimientos?

Efectivamente, una vez superada cada formación, podrás descargarte el diploma acreditativo de cada una de ellas. Añádelas a tu CV y mejora tu perfil para las empresas.

También podrás obtener un diploma de nivel superior al superar todas las formaciones de la lista.

Este curso está dirigido a perfiles de desarrollo de software con conocimientos previos intermedios o avanzados en procesamiento de datos, además de a perfiles intermedios y avanzados en ingeniería de datos o ciencia de datos que quieren automatizar procesos utilizando las herramientas de la nube de AWS.

Para poder seguirla de forma adecuada es necesario tener conocimientos a nivel intermedio de la consola de AWS, además de conocimientos intermedios-avanzados tanto sobre bases de datos y SQL, como sobre los conceptos de flujos de datos en Data Lake y Data Warehouse.

En esta formación aprenderás a procesar datos semi-estructurados que se ha almacenado previamente en AWS S3, utilizando para ello AWS Glue para transformar y dar estructura a estos datos, insertarlos posteriormente a un Data Warehouse montado sobre AWS Redshift y, finalmente, visualizarlos de en gráficos de AWS QuickSight.

En el primero de los apartados en los que se divide este curso, se hará una completa introducción del servicio AWS Glue y Glue Catalog, explicando qué son estos servicios y para qué sirven, además de aprender a crear eventos de AWS S3. También veremos en esta primera parte con la explicación sobre qué es AWS Redshift y cómo es su arquitectura. Se completa el bloque con un test de autoevaluación para poner a prueba los conocimientos adquiridos.

El segundo apartado formativo está centrado en la creación de un Data Pipeline con AWS Glue, detallando todas sus fases, desde la creación de un clúster Redshift y su IAM, hasta la creación de un Glue Job, la exploración con Glue Job Studio y su monitorización posterior. Al final encontrarás otro test de autoevaluación para chequear tu aprendizaje.

Para concluir el curso, aprenderás a explorar el dataset resultante desde la interfaz gráfica de Redshift a lo largo de dos lecciones. En la primera se hará la exploración de los datos dentro de Redshift, y en la segunda se conectará el trigger de S3 al Glue Job. De nuevo, como cierre del apartado, podrás hacer el correspondiente test para autoevaluar los conocimientos adquiridos.

Artículos
Ver todos