OpenWebinars

Aprendizaje automático con Spark en Google Cloud Dataproc

¿Quieres aprender a hacer modelos de aprendizaje automático dentro del entorno Google Cloud Platform? En esta formación práctica se explicará cómo hacerlo con Spark dentro del servicio Google Cloud Dataproc.


Icono de la tecnología

La metodología y plataforma de formación que se adapta al tamaño y ritmo de tu empresa.

Cuéntanos tu caso

Curso impartido por

Avatar:Jorge López Blasco

Jorge López Blasco

Experto en Cloud Computing, Machine Learning y Big Data.

Contenido de la formación

3 Secciones · 4 Lecciones · 42 min. en total

Introducción

12 min.

Aprendizaje automático con Spark en Google Cloud Dataproc

26 min.

Conclusiones

4 min.

Habilidades que obtendrás

  • Crear un conjunto de datos de entrenamiento para aprendizaje automático con Spark.
  • Desarrollar un modelo de aprendizaje automático de regresión logística con Spark.
  • Evaluar el comportamiento predictivo de un modelo de aprendizaje automático con Spark en Google Cloud Datalab.

Requisitos mínimos

Para un mejor aprovechamiento de esta formación, es recomendable estar familiarizado con una variedad de servicios de Google Cloud como Dataproc, así como tener una comprensión básica de los conceptos y términos relacionados con el aprendizaje automático y Spark.

Completa tu formación con estos contenidos

Icono de la tecnología
Curso

Arquitectura serverless con AWS Lambda

Avanzado
3 h. y 19 min.

Esta formación se enfoca en el desarrollo y despliegue de aplicaciones sin servidor utilizando AWS Lambda y FaaS...

Juan Duque Dauder
4.5
Icono de la tecnología
Curso

Ingeniería de datos avanzada con Databricks

Intermedio
1 h. y 52 min.

Esta formación proporciona una capacitación detallada sobre las herramientas y técnicas avanzadas necesarias para optimizar la ingestión, transformación...

Alberto Alonso Marcos
4.3

Preguntas frecuentes

Resuelve tus dudas o contacta con nosotros para más información.

Cuéntanos tu caso
Efectivamente, una vez superada cada formación, podrás descargarte el diploma acreditativo de cada una de ellas. Añádelas a tu CV y mejora tu perfil para las empresas. También podrás obtener un diploma de nivel superior al superar todas las formaciones de la ruta.

En OpenWebinars no vendemos formaciones.

Tenemos diferentes tipos de suscripciones, que te dará acceso completo a todas las formaciones de la plataforma y a las nuevas que vamos lanzando, siempre y cuando tu suscripción esté activa (como Spotify con la música o Netflix con las películas y series).

¿Eres una empresa? Tenemos planes especiales para ti. Consúltanos aquí.

En OpenWebinars las formaciones no tienen fecha de inicio y de final.

Cada curso tiene una fecha de publicación y desde ese día estarán 100% disponible todos los contenidos del curso para los usuarios suscritos a alguno de nuestros planes.

En este curso práctico se realizará la implementación de la regresión logística mediante una biblioteca de aprendizaje automático en Apache Spark, que se ejecuta en un clúster de Google Cloud Dataproc, para desarrollar un modelo de datos a partir de un conjunto de datos multivariable.

El alumno que quiera realizar esta formación, debería tener conocimientos previos con los servicios que ofrece Google Cloud Platform, sobre todo Dataproc en este caso concreto. También debería tener nociones sobre cloud computing en general y una comprensión básica de los conceptos y términos relacionados con el aprendizaje automático y Spark.

A lo largo de este curso se realizará todo el proceso de forma práctica y explicando el paso a paso. Se comienza realizando un conjunto de datos de entrenamiento para aprendizaje automático con Spark, para lo que se creará un cluster de Dataproc y se iniciará la sesión de PySpark.

Posteriormente se desarrollará un modelo de aprendizaje automático de regresión logística con Spark, se guardará el mismo y se procederá a evaluar el comportamiento predictivo de ese modelo con Spark en Google Cloud Datalab.