Business Intelligence

Curso de Web scraping: Extracción de datos en la Web

Si quieres aprender cómo hacer web scraping con Python de forma sencilla, puedes comenzar realizando este completo curso de web scraping online y en castellano que te presentamos en nuestra plataforma formativa.

Impartido por:

4.5 (203 valoraciones)
4 horas y 4 minutos · Curso
Web scraping

Lo que aprenderás en este curso:

  • Aprenderás a extraer datos web de diversa naturaleza
  • Conocerás librerías del lenguaje Python destinadas a la extracción y procesamiento de datos web
  • Conocerás cómo se comparten datos en la web a través de APIs
  • Conocerás formatos de datos semiestructurados como JSON y XML
  • Serás capaz de extraer datos de redes sociales como Twitter
  • Conocerás diversas APIs de Inteligencia Artificial

Requisitos del curso

Se recomienda haber realizado el curso Python desde cero previamente para entender los códigos Python desarrollados durante el curso. No es un requisito obligatorio ya que el curso también cubre las nociones básicas de este lenguaje de programación.

Valoraciones de estudiantes:

  • 5
  • 4
  • 3
  • 2
  • 1
4.5
203 valoraciones

Contenido del curso:

    • 2m
    • Introducción a la web
      6m
    • Introducción a Python: Creación de nuestro primer notebook
      7m
    • Introducción a Python: Primeros pasos con Jupyter Notebook
      8m
    • Introducción a Python: Captura de excepciones
      8m
    • Introducción a Python: Iteraciones
      6m
    • Introducción a Python: Listas
      9m
    • Crawling, scraping y parsing
      6m
    • Navegadores web y el protocolo HTTP
      13m
    • Scraping y parsing de webs HTML
      11m
    • Web crawlers
      14m
    • Web scraping con Selenium
      17m
    • Otras herramientas de Web scraping
      3m
    • PRÁCTICA: Extracción del texto de un discurso
      12m
    • PRÁCTICA: Extraer el valor de un fondo de inversión
      9m
    • Uso de Servicios Web
      4m
    • Formatos JSON y XML: Lectura y parsing de XML
      11m
    • Formatos JSON y XML: Lectura y parsing de JSON
      5m
    • Concepto de API
      10m
    • Seguridad y uso de APIs
      4m
    • APIs de Inteligencia Artificial
      9m
    • PRÁCTICA: Llamada a API de servicio web
      16m
    • PRÁCTICA: Llamada a API de tipo POST
      13m
    • Utilización de la API de Twitter (Parte I)
      13m
    • Utilización de la API de Twitter (Parte II)
      7m
    • Utilización de la API de Twitter (Parte III)
      12m
También te puede interesar

Te dejamos una selección de cursos, carreras y artículos

Equipos Metodologías

Qué es y por qué usar el Web Scraping

17 Junio 2019 Rafael Zambrano

Dudas frecuentes

1

¿Cuál es el precio?

En OpenWebinars no vendemos formaciones.

Tenemos diferentes tipos de suscripciones, que te dará acceso completo a todas las formaciones de la plataforma y a las nuevas que vamos lanzando, siempre y cuando tu suscripción esté activa (como Spotify con la música o Netflix con las películas y series).

¿Eres una empresa? Tenemos planes especiales para ti. Consúltanos aquí.

2

¿Cuándo comienza la formación?

En OpenWebinars las formaciones no tienen fecha de inicio y de final.

Cada curso tiene una fecha de publicación y desde ese día estarán 100% disponible todos los contenidos del curso para los usuarios suscritos a alguno de nuestros planes.

3

¿Obtengo un diploma de certificación?

En todos los cursos existe un examen final para evaluar tus conocimientos adquiridos. Si superas este examen con más de un 80% de preguntas correctas obtendrás el diploma de certificación. Puedes realizar un intento cada 24 horas.

Este diploma es un certificado privado emitido por OpenWebinars, y valorado en el mundo empresarial, ya que tenemos grandes compañías clientes que se forman con nosotros y valoran nuestras certificaciones.

No olvides poner tu certificación en tu perfil Linkedin y en tu currículum.

Este curso de extracción de datos lo puedes realizar sin tener conocimientos previos en esta técnica, ya que de forma teórica y práctica aprenderás a realizar esta práctica. En esta ocasión utilizaremos el lenguaje de programación Python 3 para ello, del que tampoco se requiere tener conocimientos.

El desarrollo del curso se lleva a cabo a lo largo de cuatro apartados, que a su vez están divididos en lecciones, para que así puedas ir avanzando entre ellas de una forma ordenada y comprendiendo bien lo anterior antes de avanzar.

Para comenzar el tutor ha preparado una introducción muy interesante y completa, en la cual se hará una primera visión general de algunos conceptos básicos que se deben conocer para poder aplicarlos a lo largo del resto del curso.

Lo primero que verás será una introducción a la web para conocerla un poco más, ya que si lo que pretendemos es extraer datos de la misma, es necesario saber algunas cuestiones importantes sobre la misma y su evolución.

El resto del bloque introductorio se dedica a ver un poco el lenguaje Python, ya que será el que se emplee posteriormente en toda la parte de web scraping. Aparte de una pequeña reseña sobre este lenguaje, aprenderás a instalarlo junto con Jupyter y Anaconda, y a preparar el entorno necesario para utilizar las prácticas de las siguientes lecciones.

Tras la instalación y preparación del sistema necesario, comenzarás aprender a programar con Python, utilizando los conceptos que se necesitarán para hacer la extracción de datos de webs. Conocerás cómo crear un notebook y a utilizar los comandos más básicos de Python, como por ejemplo los operadores, las expresiones o los condicionales.

El resto de este primer apartado lo dedicaremos a desarrollar la captura de excepciones, las funciones, las iteraciones, tipos de bucles, listas y diccionarios, todos conceptos que son imprescindibles para realizar el web scraping con Python.

Acabada ya la primera fase del curso de extracción de datos con Python, más enfocada a introducir conceptos y técnicas básicas para realizar este proceso, podrás entrar ya en el grueso de la formación, como es el apartado centrado en web scraping, web crawling y parsing.

En las diferentes lecciones que encontrarás dentro de este bloque, irás aprendiendo los conceptos fundamentales de estas tres técnicas, para que conozcas los mismos y su funcionamiento, para que sepas diferenciarlos antes de pasar a aprender a extraer los datos de la web.

Adicionalmente verás una lección dedicada en exclusiva a los navegadores web y al protocolo HTTP, para conocer sus bases y aspectos que son necesarios saber para poder realizar posteriormente el web scraper.

Tras haber visto todos estos aspectos previos necesarios, vas a entrar ya a realizar el scraping y parsing de webs HTML, utilizando la librería BeautifulSoup para Python, que sirve para extraer y analizar código HTML. También te contamos cómo hacer un web crawler para capturar los enlaces de la web que nos interese, de una forma práctica y sencilla.

El siguiente paso será aprender a realizar web scraping con la librería Selenium, que ofrece una serie de ventajas. Verás cómo realizar su instalación y su posterior uso paso a paso, con un completo ejemplo que te será de gran utilidad.

Para finalizar este bloque acabaremos con una clase en la que se detallarán algunas otras herramientas que permiten hacer web scraping que pueden resultar interesantes en algunos casos, y una práctica con la que se realizará la extracción de datos de una web utilizando todo lo que se ha explicado previamente.

El tercer segmento de este curso trata sobre el uso de servicios web y APIs, que nos permitirán extraer datos de las web de una forma más adecuada y consiguiendo además obtener los datos en un mejor formato que el HTML, como son JSON y XML.

Te explicaremos los tipos de servicios web y APIs, sus ventajas de uso y para qué nos sirven, además de cómo tratar los datos que se obtienen con ellas. En las diferentes lecciones sobre APIs veremos aspectos tan importantes como la seguridad en el uso de las mismas y algunas APIs de Inteligencia Artificial de gran potencial.

Para completar toda esta parte teórica, realizaremos una práctica completa en Python en la que se llamará a una API de un servicio web que proporciona información de interés con los que trabajar posteriormente.

Adicionalmente y como punto final al curso, hemos preparado un ejemplo sobre una aplicación práctica del web scraping, que seguro que te va a servir para tener todo mucho más claro y darle más sentido a lo visto en el resto del curso. En concreto utilizaremos las diferentes APIs de Twitter, con la que extraer datos de esta red social.

Esperamos te animes a realizar este curso de web scraping con Python y te ayude en tus proyectos, tanto personales como laborales, ya que es una técnica cada vez más utilizada y con un gran potencial, por lo que merece la pena aprender a utilizarla.

Artículos
Ver todos