Conocimientos y habilidades que adquieres realizando este curso

  • Aprenderás a extraer datos web de diversa naturaleza
  • Conocerás librerías del lenguaje Python destinadas a la extracción y procesamiento de datos web
  • Conocerás cómo se comparten datos en la web a través de APIs
  • Conocerás formatos de datos semiestructurados como JSON y XML
  • Serás capaz de extraer datos de redes sociales como Twitter
  • Conocerás diversas APIs de Inteligencia Artificial

Temario

Introducción 47m

  • Presentación (vista previa)

    2m
  • Introducción a la web

    6m
  • Introducción a Python: Creación de nuestro primer notebook

    7m
  • Introducción a Python: Primeros pasos con Jupyter Notebook

    8m
  • Introducción a Python: Captura de excepciones

    8m
  • Introducción a Python: Iteraciones

    6m
  • Introducción a Python: Listas

    9m
  • Crawling, scraping y parsing

    6m
  • Navegadores web y el protocolo HTTP

    13m
  • Scraping y parsing de webs HTML

    11m
  • Web crawlers

    14m
  • Web scraping con Selenium

    17m
  • Otras herramientas de Web scraping

    3m
  • PRÁCTICA: Extracción del texto de un discurso

    12m
  • PRÁCTICA: Extraer el valor de un fondo de inversión

    9m
  • Uso de Servicios Web

    4m
  • Formatos JSON y XML: Lectura y parsing de XML

    11m
  • Formatos JSON y XML: Lectura y parsing de JSON

    5m
  • Concepto de API

    10m
  • Seguridad y uso de APIs

    4m
  • APIs de Inteligencia Artificial

    9m
  • PRÁCTICA: Llamada a API de servicio web

    16m
  • PRÁCTICA: Llamada a API de tipo POST

    13m
  • Utilización de la API de Twitter (Parte I)

    13m
  • Utilización de la API de Twitter (Parte II)

    7m
  • Utilización de la API de Twitter (Parte III)

    12m

Relacionado

Te dejamos una selección de cursos, carreras y artículos

Qué es y por qué usar el Web Scraping

Qué es y por qué usar el Web Scraping

Metodologías y herramientas

17 de Junio de 2019

El web scraping es una técnica muy utilizada en la actualidad, si quieres saber más sobre ella, te contamos qué es y los muchos usos que tiene.

 

Programador full stack MEVN

Programador full stack MEVN

carrera

Incluye 7 cursos:

  • Curso de HTML5 y CSS3
  • Curso de JavaScript Profesional
  • Curso de Git, GitHub y Jekyll

y 4 cursos más!

Duración: 43 horas y 49 minutos

Preguntas Frecuentes

En OpenWebinars no vendemos cursos o talleres unitarios.

Tenemos diferentes tipos de suscripciónes, que te dará acceso completo a todos los cursos de la plataforma y a los nuevos que vamos lanzando, siempre y cuando tu suscripción esté activa (como Spotify con la música o Netflix con las películas y series).

¿Eres una empresa? Tenemos planes especiales para tí. Consúltanos aquí.

En OpenWebinars los cursos no tienen fecha de inicio y de final.

Cada curso tiene una fecha de publicación y desde ese día estarán 100% disponible todos los contenidos del curso para los usuarios suscritos a alguno de nuestro planes.

Si estás suscrito al plan Profesional o VIP, en todos los cursos existe un examen final para evaluar tus conocimientos adquiridos. Si superas este examen con más de un 80% de preguntas correctas obtendrás el diploma de certificación. Puedes realizar un intento cada 24 horas.

Este diploma es un certificado privado emitido por OpenWebinars, y valorado en el mundo empresarial, ya que tenemos grandes compañías clientes que se forman con nosotros y valoran nuestras certificaciones.

No olvides poner tu certificación en tu perfil Linkedin y en tu currículum.

Descripción

Si quieres aprender cómo hacer web scraping con Python de forma sencilla, puedes comenzar realizando este completo curso de web scraping online y en castellano que te presentamos en nuestra plataforma formativa.

Este curso de extracción de datos lo puedes realizar sin tener conocimientos previos en esta técnica, ya que de forma teórica y práctica aprenderás a realizar esta práctica. En esta ocasión utilizaremos el lenguaje de programación Python 3 para ello, del que tampoco se requiere tener conocimientos.

El desarrollo del curso se lleva a cabo a lo largo de cuatro apartados, que a su vez están divididos en lecciones, para que así puedas ir avanzando entre ellas de una forma ordenada y comprendiendo bien lo anterior antes de avanzar.

Para comenzar el tutor ha preparado una introducción muy interesante y completa, en la cual se hará una primera visión general de algunos conceptos básicos que se deben conocer para poder aplicarlos a lo largo del resto del curso.

Lo primero que verás será una introducción a la web para conocerla un poco más, ya que si lo que pretendemos es extraer datos de la misma, es necesario saber algunas cuestiones importantes sobre la misma y su evolución.

El resto del bloque introductorio se dedica a ver un poco el lenguaje Python, ya que será el que se emplee posteriormente en toda la parte de web scraping. Aparte de una pequeña reseña sobre este lenguaje, aprenderás a instalarlo junto con Jupyter y Anaconda, y a preparar el entorno necesario para utilizar las prácticas de las siguientes lecciones.

Tras la instalación y preparación del sistema necesario, comenzarás aprender a programar con Python, utilizando los conceptos que se necesitarán para hacer la extracción de datos de webs. Conocerás cómo crear un notebook y a utilizar los comandos más básicos de Python, como por ejemplo los operadores, las expresiones o los condicionales.

El resto de este primer apartado lo dedicaremos a desarrollar la captura de excepciones, las funciones, las iteraciones, tipos de bucles, listas y diccionarios, todos conceptos que son imprescindibles para realizar el web scraping con Python.

Acabada ya la primera fase del curso de extracción de datos con Python, más enfocada a introducir conceptos y técnicas básicas para realizar este proceso, podrás entrar ya en el grueso de la formación, como es el apartado centrado en web scraping, web crawling y parsing.

En las diferentes lecciones que encontrarás dentro de este bloque, irás aprendiendo los conceptos fundamentales de estas tres técnicas, para que conozcas los mismos y su funcionamiento, para que sepas diferenciarlos antes de pasar a aprender a extraer los datos de la web.

Adicionalmente verás una lección dedicada en exclusiva a los navegadores web y al protocolo HTTP, para conocer sus bases y aspectos que son necesarios saber para poder realizar posteriormente el web scraper.

Tras haber visto todos estos aspectos previos necesarios, vas a entrar ya a realizar el scraping y parsing de webs HTML, utilizando la librería BeautifulSoup para Python, que sirve para extraer y analizar código HTML. También te contamos cómo hacer un web crawler para capturar los enlaces de la web que nos interese, de una forma práctica y sencilla.

El siguiente paso será aprender a realizar web scraping con la librería Selenium, que ofrece una serie de ventajas. Verás cómo realizar su instalación y su posterior uso paso a paso, con un completo ejemplo que te será de gran utilidad.

Para finalizar este bloque acabaremos con una clase en la que se detallarán algunas otras herramientas que permiten hacer web scraping que pueden resultar interesantes en algunos casos, y una práctica con la que se realizará la extracción de datos de una web utilizando todo lo que se ha explicado previamente.

El tercer segmento de este curso trata sobre el uso de servicios web y APIs, que nos permitirán extraer datos de las web de una forma más adecuada y consiguiendo además obtener los datos en un mejor formato que el HTML, como son JSON y XML.

Te explicaremos los tipos de servicios web y APIs, sus ventajas de uso y para qué nos sirven, además de cómo tratar los datos que se obtienen con ellas. En las diferentes lecciones sobre APIs veremos aspectos tan importantes como la seguridad en el uso de las mismas y algunas APIs de Inteligencia Artificial de gran potencial.

Para completar toda esta parte teórica, realizaremos una práctica completa en Python en la que se llamará a una API de un servicio web que proporciona información de interés con los que trabajar posteriormente.

Adicionalmente y como punto final al curso, hemos preparado un ejemplo sobre una aplicación práctica del web scraping, que seguro que te va a servir para tener todo mucho más claro y darle más sentido a lo visto en el resto del curso. En concreto utilizaremos las diferentes APIs de Twitter, con la que extraer datos de esta red social.

Esperamos te animes a realizar este curso de web scraping con Python y te ayude en tus proyectos, tanto personales como laborales, ya que es una técnica cada vez más utilizada y con un gran potencial, por lo que merece la pena aprender a utilizarla.

* Requisitos del Curso

Se recomienda haber realizado el curso Python desde cero previamente para entender los códigos Python desarrollados durante el curso. No es un requisito obligatorio ya que el curso también cubre las nociones básicas de este lenguaje de programación.

Estas son algunas de las empresas que ya confían en OpenWebinars

Profesores y profesionales

Nuestros docentes son profesionales que trabajan día a día en la materia que imparten

Conviértete en profesor de OpenWebinars