Las cookies nos permiten ofrecer nuestros servicios. Al utilizar nuestros servicios, aceptas el uso que hacemos de las cookies. Más Información. Aceptar

Importancia de la visualización de datos

Abraham Requena Mesa
  • Escrito por Abraham Requena Mesa el 10 de Noviembre de 2020
  • 2 min de lectura Big Data
Importancia de la visualización de datos

Una imagen vale más que mil palabras

Un científico de datos o cualquiera que trabaje con datos, tiene siempre que intentar mostrar los resultados de la manera más bonita y, sobre todo, más fácil de interpretar para aquel que lo vaya a usar. Si, por ejemplo, tenemos que generar un informe para un director de área, seguramente con un buen gráfico le va a ser mucho más fácil sacar conclusiones que con una hoja de Excel gigante.

En este ejemplo lo veremos de una forma más sencilla.

Tenemos este conjunto de datos sacados de un archivo .csv, y el mismo contiene características sobre casas, el precio, el número de habitaciones, de baños y una serie de características más. Es cierto que mostrando este conjunto de datos somos capaces de sacar conclusiones o sacar algún tipo de valor.

Imagen 0 en Importancia de la visualización de datos

Por ejemplo, si queremos mostrar cuántos dormitorios tiene la casa con el precio máximo y la casas con el precio mínimo, podremos empezar a buscar entre los datos de las casas y localizar ambos resultados.

Imagen 1 en Importancia de la visualización de datos

Pero, ¿qué ocurre si en lugar de ese conjunto de datos, mostramos este gráfico y queremos saber cuántos dormitorios tiene la casa con el precio máximo y la casa con el precio mínimo? De un vistazo somos capaces directamente de saber qué número de habitaciones tienen las casas de mayor y menor precio, gracias a que las barras son mucho más fáciles de interpretar que un conjunto de datos en texto plano.

Imagen 2 en Importancia de la visualización de datos

Importancia del color

El color en la visualización de datos es también muy importante. Veamos unos ejemplos.

En esta gráfica estamos representando dos variables, pero, además del hecho de no tener ninguna leyenda que nos diga qué variables se están representando, aunque la tuviéramos, ambas están en azul, poco podemos saber.

Imagen 3 en Importancia de la visualización de datos

Si cada variable la representamos de un color distinto y añadimos una leyenda, la calidad del gráfico aumenta considerablemente.

Imagen 4 en Importancia de la visualización de datos

Calidad de los gráficos

La calidad de un gráfico se suele basar en muchas características, de las que destacaremos las siguientes:

  • Los valores de los ejes: Por ejemplo, en la gráfica anterior, en el eje X únicamente tenemos marcados los números de habitaciones 0, 2, 4, 6 y 8, cuando también existen números de habitaciones como 1, 3 o 5. Si en nuestro gráfico mostramos en ese eje todos los valores, el gráfico estará ganando calidad.

  • Título: Con un título añadimos información sobre qué estamos representando en el gráfico, lo que ayuda a tener más información sobre los datos representados.

  • Leyenda: Una leyenda siempre ayuda mucho a la hora de entender o comprender el gráfico.

Un ejemplo de un gráfico que cumple estas tres características fundamentales es el siguiente:

Imagen 5 en Importancia de la visualización de datos

Librerías para la creación de gráficos

Para acabar, destacamos algunas de las librerías que están relacionadas o que pueden ser usadas para la creación de gráficos con Python:

  • Matplotlib
  • Seaborn
  • Bokeh
  • Altair

Relacionado

Te dejamos una selección de cursos, carreras y artículos

Curso de Python 3 desde cero

Curso de Python 3 desde cero

curso

Con este curso aprenderás:

  • Instalación de Python3.
  • Codificar y ejecutar programas Python.
  • Estructura de un programa Python.

Duración: 6 horas y 13 minutos

Curso de NumPy con Python

Curso de NumPy con Python

curso

Con este curso aprenderás:

  • Conocerás los tipos de datos disponibles en Numpy
  • Aprenderás a generar nuevos arrays de datos
  • Aprenderás a realizar operaciones con Numpy

Duración: 3 horas y 30 minutos

Más de 300 empresas confían en nosotros

Oesia
Vass
Everis
Ayesa
Altran
Ibermatica
Atmira
GFI
Accenture
GMV
Concatel
Telefonica
Caser
Banco de España
kpmg
Mapfre
Randstad