Big Data

Conociendo PySpark

En esta formación aprenderás los conceptos fundamentales para el uso del framework y la librería de PySpark de Python. También se abordarán temáticas asociadas al cómputo distribuido a través de la herramienta de Spark.

Impartido por:

4.2 (9 valoraciones)
3 horas y 10 minutos · Curso
Conociendo PySpark

Lo que aprenderás en este curso:

  • Uso y conceptualización de PySpark.
  • Fundamentos de Spark.
  • Entendimiento del Big Data y tecnologías asociadas.

Requisitos del curso

Para realizar esta formación es recomendable tener conocimientos intermedios de Python así como uso y manejo fluido con la librería de Pandas.

Valoraciones de estudiantes:

  • 5
  • 4
  • 3
  • 2
  • 1
4.2
9 valoraciones

Contenido del curso:

    • 2m
    • Fundamentos del Big Data y ejemplos de su aplicación
      13m
    • Tipos y fuentes de datos
      12m
    • Tecnologías y conceptos complementarios
      11m
    • Test de autoevaluación
    • Ecosistema del Big Data y las tecnologías principales
      14m
    • Apache Hadoop
      11m
    • Apache Spark
      13m
    • Test de autoevaluación
    • Repaso de Python y del entorno de trabajo
      12m
    • PySpark, conceptos, documentación e instalación
      8m
    • Conociendo PySpark
      9m
    • Test de autoevaluación
    • Funciones en PySpark
      11m
    • Analítica de datos con PySpark
      10m
    • Introducción a Apache Koala
      8m
    • Test de autoevaluación
    • Fundamentos del Machine Learning
      10m
    • Tipos de aprendizaje y aplicación del ML
      8m
    • Ejemplo y laboratorio práctico
      12m
    • Test de autoevaluación
    • 5m
    • Creación de clústeres y ejecución de archivos
      5m
    • Carga e ingesta de datos
      7m
    • Test de autoevaluación
    • Conclusiones y próximos pasos
      1m
También te puede interesar

Te dejamos una selección de cursos, carreras y artículos

Transforma y maneja datos con Apache Spark en Azure Synapse Analytics

Transformación y manejo de datos con Apache Spark en Azure Synapse Analytics

1 hora y 38 segundos · Curso

En esta formación aprenderás a usar el servicio de Azure Synapse Analytics, a crear clusters de Spark con el servicio de Apache Spark Pool, y …

  • Cloud Computing
Implementar una Data Pipeline con AWS EMR y PySpark

Curso de Implementación de una Data Pipeline con AWS EMR y PySpark

1 hora y 41 minutos · Curso

En esta formación exploramos los conceptos de la ejecución de cargas de trabajo en un clúster de EMR optimizado y utilizamos PySpark para realizar las …

  • Cloud Computing

Dudas frecuentes

1

¿Cuándo comienza la formación?

En OpenWebinars las formaciones no tienen fecha de inicio y de final.

Cada curso tiene una fecha de publicación y desde ese día estarán 100% disponible todos los contenidos del curso para los usuarios suscritos a alguno de nuestros planes.

2

¿Puedo obtener un diploma que acredite mis conocimientos?

Efectivamente, una vez superada cada formación, podrás descargarte el diploma acreditativo de cada una de ellas. Añádelas a tu CV y mejora tu perfil para las empresas.

También podrás obtener un diploma de nivel superior al superar todas las formaciones de la carrera.

3

¿Cuál es el precio?

En OpenWebinars no vendemos formaciones.

Tenemos diferentes tipos de suscripciones, que te dará acceso completo a todas las formaciones de la plataforma y a las nuevas que vamos lanzando, siempre y cuando tu suscripción esté activa (como Spotify con la música o Netflix con las películas y series).

¿Eres una empresa? Tenemos planes especiales para ti. Consúltanos aquí.

Las cookies nos permiten ofrecer nuestros servicios. Al utilizar nuestros servicios, aceptas el uso que hacemos de las cookies. Más Información.