Conocimientos y habilidades que adquieres realizando este curso

  • Fundamentos de Apache Spark
  • Spark SQL
  • Hacer Streaming con Spark
  • Crearás un proyecto en Twitter con Spark

Temario

  • RDDs

    15m
  • Transformaciones

    15m
  • Acciones

    6m
  • Ejercicios RDD: Ejercicio I

    5m
  • Ejercicios RDD: Ejercicio II

    7m
  • Ejercicios RDD: Ejercicio III

    5m
  • Persistencia y acumuladores

    13m
  • DataFrame y DataSet (parte I)

    15m
  • DataFrame y DataSet (parte II)

    17m
  • DataFrame y DataSet (parte III)

    7m
  • DataFrame y DataSet (parte IV)

    13m
  • Ejercicios con DataFrame y DataSet: Ejercicio I

    6m
  • Ejercicios con DataFrame y DataSet: Ejercicio II

    6m
  • Ejercicios con DataFrame y DataSet: Ejercicio III (vista previa)

    4m
  • Vistas

    9m
  • Ejercicio con Vistas

    7m
  • Structured Streaming (parte I)

    9m
  • Structured Streaming (parte II)

    12m
  • Structured Streaming (parte III)

    18m
  • Ventanas y watermark

    16m
  • Ejercicios con Streaming: Ejercicio I

    6m
  • Ejercicios con Streaming: Ejercicio II

    8m
  • Operación join y Monitorización

    11m
  • Spark Streaming DStream

    12m
  • Operaciones con ventana

    5m
  • Trabajando con Dataframe

    6m
  • Preparación del IDE

    8m
  • Ingestando tweets (parte I)

    11m
  • Ingestando tweets (parte II)

    9m
  • Ejercicios con Twitter: Ejercicio I

    11m
  • Ejercicios con Twitter: Ejercicio II

    10m

Relacionado

Te dejamos una selección de cursos, carreras y artículos

Preguntas Frecuentes

En OpenWebinars no vendemos cursos o talleres unitarios.

Tenemos diferentes tipos de suscripciónes, que te dará acceso completo a todos los cursos de la plataforma y a los nuevos que vamos lanzando, siempre y cuando tu suscripción esté activa (como Spotify con la música o Netflix con las películas y series).

¿Eres una empresa? Tenemos planes especiales para tí. Consúltanos aquí.

Si estás suscrito al plan Profesional o VIP, en todos los cursos existe un examen final para evaluar tus conocimientos adquiridos. Si superas este examen con más de un 80% de preguntas correctas obtendrás el diploma de certificación. Puedes realizar un intento cada 24 horas.

Este diploma es un certificado privado emitido por OpenWebinars, y valorado en el mundo empresarial, ya que tenemos grandes compañías clientes que se forman con nosotros y valoran nuestras certificaciones.

No olvides poner tu certificación en tu perfil Linkedin y en tu currículum.

En OpenWebinars los cursos no tienen fecha de inicio y de final.

Cada curso tiene una fecha de publicación y desde ese día estarán 100% disponible todos los contenidos del curso para los usuarios suscritos a alguno de nuestro planes.

Descripción

 

Comienza a formarte con este curso Spark para ser parte del gran futuro que tiene todo lo relacionado con el Big Data, un campo que está en pleno auge y no para de crecer.

El análisis y procesamiento de datos dejará de ser un misterio para ti una vez hayas acabado este curso Apache Spark, un potente framework que te sorprenderá por su potencia y todo lo que permite hacer.

El comienzo de la formación será un acercamiento a los fundamentos de Apache Spark, qué es, para qué se utiliza y por qué es tan importante en el tratamiento de datos en Big Data.

Tras saber un poco más de este framework, aprenderás cómo descargarlo e instalarlo en tu sistema. También aprenderás a hacer lo mismo con Jupyter Notebook, el entorno de trabajo interactivo que emplearemos durante el resto del curso.

Después de preparar nuestro sistema, comenzaremos el curso teórico-práctico, viendo en primer lugar Spark SQL, la herramienta que incluye este framework para procesar datos estructurados, que se basa en SQL, como su nombre indica.

En este apartado vas a conocer y a aprender a emplear esta herramienta a fondo, comprendiendo qué son los DataFrame y DataSet, entre otros conceptos relacionados. Y al final del mismo podrás hacer un ejercicio práctico para poner a prueba tus conocimientos.

Seguidamente podrás seguir con el bloque dedicado Spark Streaming, otro de los componentes del framework Apache Spark, que en este caso se encarga de la ingesta y procesamiento de datos de múltiples fuentes.

En este apartado vas a conocer el mecanismo de Structured Streaming que emplea Spark para recibir y tratar esos datos, por el que los convierte en un flujo denominado DStream. Además veremos otros conceptos relacionados y haremos otro completo ejercicio sobre todo lo visto.

El final del curso se dedicará a realizar un proyecto práctico, que en este caso se hará empleando Twitter. Este proyecto consistirá en preparar un IDE con el que comenzaremos a ingestar tweets, que posteriormente trataremos en unos ejercicios.

Como has visto es un curso de Big Data que incluye todo lo necesario para para comenzar a adentrarte en este fascinante mundo.

 

* Requisitos del Curso

Un ordenador o cualquier otro dispositivo con conexión a Internet

Estas son algunas de las empresas que ya confían en OpenWebinars

Profesores y profesionales

Nuestros docentes son profesionales que trabajan día a día en la materia que imparten

Conviértete en profesor de OpenWebinars