Cloud

Ingeniería de datos avanzada con Databricks

Si lo tuyo es la ingeniería de datos, este curso avanzado es ideal para aprender a sacarle partido a Databricks. Aprenderás a configurar, optimizar y securizar tu entorno de datos en la nube, utilizando las herramientas más avanzadas disponibles en Azure Cloud.
4.5 (4 valoraciones)
1 hora y 52 minutos · Curso
Ingeniería de datos avanzada con Databricks

Lo que aprenderás en este curso:

  • Configurar un entorno de Databricks en Azure Cloud, integrándolo con otros servicios de Azure clave.
  • Técnicas avanzadas de procesamiento de datos utilizando Spark en Databricks, incluyendo RDD, Dataframes y Spark SQL.
  • Optimizar el rendimiento de los flujos de trabajo de datos utilizando técnicas como Data Skipping, Z-Order y Bucket Tables.
  • Implementar medidas de seguridad y control de acceso utilizando Azure Key Vault para proteger las credenciales y secretos.

Requisitos del curso

Se recomienda tener conocimiento de los conceptos básicos de la ingeniería de datos y procesamiento de datos con Databricks y familiaridad con los servicios de Azure Cloud. 

Valoraciones de estudiantes:

  • 5
  • 4
  • 3
  • 2
  • 1
4.5
4 valoraciones

Contenido del curso:

    • 4m
    • Databricks Workspace
      4m
    • Práctica: Databricks Workspaces
      6m
    • Microsoft Data Ecosystem
      6m
    • Microsoft Data Ecosystem en la práctica
      9m
    • Spark en Databricks
      6m
    • Spark en Databricks en la práctica
      15m
    • Data Ingestion
      11m
    • Data Ingestion Streaming Data en Delta Lake
      21m
    • Optimizar el rendimiento
      9m
    • Práctica: Cómo optimizar el rendimiento en Databricks
      16m
    • Conclusión y próximos pasos
      1m
También te puede interesar

Te dejamos una selección de cursos, carreras y artículos

Fundamentos de Databricks Lakehouse

Fundamentos de Databricks Lakehouse

2 horas y 21 minutos · Curso

Databricks Lakehouse, una plataforma integral para el procesamiento y análisis de datos en la nube. Aprenderás sobre los conceptos clave de Data Lakehouse, la arquitectura …

  • Cloud
Azure Databricks

Azure Databricks

1 hora y 2 minutos · Taller

Gracias a este taller, conocerás el servicio de Databricks en la nube, sus características, ámbitos de aplicación mediante la creación de clústeres y ejecución de …

  • Azure

Dudas frecuentes

1

¿Cuándo comienza la formación?

En OpenWebinars las formaciones no tienen fecha de inicio y de final.

Cada curso tiene una fecha de publicación y desde ese día estarán 100% disponible todos los contenidos del curso para los usuarios suscritos a alguno de nuestros planes.

2

¿Puedo obtener un diploma que acredite mis conocimientos?

Efectivamente, una vez superada cada formación, podrás descargarte el diploma acreditativo de cada una de ellas. Añádelas a tu CV y mejora tu perfil para las empresas.

También podrás obtener un diploma de nivel superior al superar todas las formaciones de la lista.

3

¿Cuál es el precio?

En OpenWebinars no vendemos formaciones.

Tenemos diferentes tipos de suscripciones, que te dará acceso completo a todas las formaciones de la plataforma y a las nuevas que vamos lanzando, siempre y cuando tu suscripción esté activa (como Spotify con la música o Netflix con las películas y series).

¿Eres una empresa? Tenemos planes especiales para ti. Consúltanos aquí.

Este curso está dirigido especialmente a profesionales que buscan dominar el ecosistema de Databricks y Azure Cloud, ya que no solo cubre los fundamentos de Databricks y cómo establecer tu entorno en la nube, sino que también profundiza en técnicas avanzadas de procesamiento de datos para maximizar la eficiencia y el rendimiento de tus proyectos.

La formación comienza con una introducción a Databricks, de forma que puedas familiarizarte con su interfaz y funcionalidades clave. Aprenderás a configurar tu entorno en Azure, conectarte a fuentes de datos diversas y manejar grandes volúmenes de datos de manera efectiva, así estarás preparado para los desafíos que vienen a continuación.

El corazón del curso se centra en el procesamiento avanzado de datos con Apache Spark, explorando RDDs (Resilient Distributed Datasets), DataFrames y Spark SQL. Cada uno de estos componentes es esencial para el manejo eficaz de datos, y dominarlos te permitirá extraer insights valiosos de tus conjuntos de datos, independientemente de su tamaño.

La optimización de consultas y el rendimiento de tus aplicaciones de datos es otra área clave del curso. Aprenderás técnicas especializadas para afinar tus flujos de trabajo en Databricks, asegurando que tus aplicaciones sean no solo potentes sino también rentables. Este conocimiento es crucial en la era actual de la ingeniería de datos, donde la eficiencia y la optimización son tan importantes como la capacidad de procesamiento.

Además, abordaremos las prácticas de seguridad en Databricks, utilizando herramientas como Azure Key Vault para gestionar credenciales y secretos de forma segura. Este enfoque integral asegura que tus entornos de datos no solo sean potentes y eficientes, sino también seguros y conformes a las mejores prácticas de la industria.

Finalmente, el curso concluye con un proyecto práctico, donde tendrás la oportunidad de aplicar todo lo aprendido en un entorno real. Este proyecto integrador te desafiará a combinar tus nuevas habilidades en ingeniería de datos, desde la configuración inicial hasta el despliegue de soluciones de datos avanzadas, marcando el comienzo de tu transformación en un ingeniero de datos experto en Databricks.

Si quieres transformar tu carrera con habilidades avanzadas en ingeniería de datos con Databricks, realizando este curso estarás a un paso de convertirte en el experto en datos que siempre has querido ser.

Artículos
Ver todos