Conocimientos y habilidades que adquieres realizando este curso

  • Fundamentos de Apache Spark
  • Spark SQL
  • Hacer Streaming con Spark
  • Crearás un proyecto en Twitter con Spark

Temario

  • RDDs

    15m
  • Transformaciones

    15m
  • Acciones

    6m
  • Ejercicios RDD: Ejercicio I

    5m
  • Ejercicios RDD: Ejercicio II

    7m
  • Ejercicios RDD: Ejercicio III

    5m
  • Persistencia y acumuladores

    13m
  • DataFrame y DataSet (parte I)

    15m
  • DataFrame y DataSet (parte II)

    17m
  • DataFrame y DataSet (parte III)

    7m
  • DataFrame y DataSet (parte IV)

    13m
  • Ejercicios con DataFrame y DataSet: Ejercicio I

    6m
  • Ejercicios con DataFrame y DataSet: Ejercicio II

    6m
  • Ejercicios con DataFrame y DataSet: Ejercicio III (vista previa)

    4m
  • Vistas

    9m
  • Ejercicio con Vistas

    7m
  • Structured Streaming (parte I)

    9m
  • Structured Streaming (parte II)

    12m
  • Structured Streaming (parte III)

    18m
  • Ventanas y watermark

    16m
  • Ejercicios con Streaming: Ejercicio I

    6m
  • Ejercicios con Streaming: Ejercicio II

    8m
  • Operación join y Monitorización

    11m
  • Spark Streaming DStream

    12m
  • Operaciones con ventana

    5m
  • Trabajando con Dataframe

    6m
  • Preparación del IDE

    8m
  • Ingestando tweets (parte I)

    11m
  • Ingestando tweets (parte II)

    9m
  • Ejercicios con Twitter: Ejercicio I

    11m
  • Ejercicios con Twitter: Ejercicio II

    10m

Relacionado

Te dejamos una selección de cursos, carreras y artículos

Curso de Introducción al Big Data

Curso de Introducción al Big Data

curso

Aprende los fundamentos del Big Data y que tecnologías se usan en la actualidad en este sector.

Duración: 4 horas y 42 minutos

Preguntas Frecuentes

En OpenWebinars no vendemos cursos o talleres unitarios.

Tenemos diferentes tipos de suscripciónes, que te dará acceso completo a todos los cursos de la plataforma y a los nuevos que vamos lanzando, siempre y cuando tu suscripción esté activa (como Spotify con la música o Netflix con las películas y series).

¿Eres una empresa? Tenemos planes especiales para tí. Consúltanos aquí.

Sí, en todos los cursos existe un examen final para evaluar tus conocimientos adquiridos. Si superas este examen con más de un 80% de preguntas correctas obtendrás el diploma de certificación. Puedes realizar un intento cada 24 horas.

Este diploma es un certificado privado emitido por OpenWebinars, y valorado en el mundo empresarial, ya que tenemos grandes compañías clientes que se forman con nosotros y valoran nuestras certificaciones.

No olvides poner tu certificación en tu perfil Linkedin y en tu currículum.

En OpenWebinars los cursos no tienen fecha de inicio y de final.

Cada curso tiene una fecha de publicación y desde ese día estarán 100% disponible todos los contenidos del curso para los usuarios suscritos a alguno de nuestro planes.

Descripción

 

Comienza a formarte con este curso Spark para ser parte del gran futuro que tiene todo lo relacionado con el Big Data, un campo que está en pleno auge y no para de crecer.

El análisis y procesamiento de datos dejará de ser un misterio para ti una vez hayas acabado este curso Apache Spark, un potente framework que te sorprenderá por su potencia y todo lo que permite hacer.

El comienzo de la formación será un acercamiento a los fundamentos de Apache Spark, qué es, para qué se utiliza y por qué es tan importante en el tratamiento de datos en Big Data.

Tras saber un poco más de este framework, aprenderás cómo descargarlo e instalarlo en tu sistema. También aprenderás a hacer lo mismo con Jupyter Notebook, el entorno de trabajo interactivo que emplearemos durante el resto del curso.

Después de preparar nuestro sistema, comenzaremos el curso teórico-práctico, viendo en primer lugar Spark SQL, la herramienta que incluye este framework para procesar datos estructurados, que se basa en SQL, como su nombre indica.

En este apartado vas a conocer y a aprender a emplear esta herramienta a fondo, comprendiendo qué son los DataFrame y DataSet, entre otros conceptos relacionados. Y al final del mismo podrás hacer un ejercicio práctico para poner a prueba tus conocimientos.

Seguidamente podrás seguir con el bloque dedicado Spark Streaming, otro de los componentes del framework Apache Spark, que en este caso se encarga de la ingesta y procesamiento de datos de múltiples fuentes.

En este apartado vas a conocer el mecanismo de Structured Streaming que emplea Spark para recibir y tratar esos datos, por el que los convierte en un flujo denominado DStream. Además veremos otros conceptos relacionados y haremos otro completo ejercicio sobre todo lo visto.

El final del curso se dedicará a realizar un proyecto práctico, que en este caso se hará empleando Twitter. Este proyecto consistirá en preparar un IDE con el que comenzaremos a ingestar tweets, que posteriormente trataremos en unos ejercicios.

Como has visto es un curso de Big Data que incluye todo lo necesario para para comenzar a adentrarte en este fascinante mundo.

 

* Requisitos del Curso

Un ordenador o cualquier otro dispositivo con conexión a Internet

Estas son algunas de las empresas que ya confían en OpenWebinars

Profesores y profesionales

Nuestros docentes son profesionales que trabajan día a día en la materia que imparten

Conviértete en profesor de OpenWebinars