Importancia de la visualización de datos

Una imagen vale más que mil palabras

Un científico de datos o cualquiera que trabaje con datos, tiene siempre que intentar mostrar los resultados de la manera más bonita y, sobre todo, más fácil de interpretar para aquel que lo vaya a usar.

Si, por ejemplo, tenemos que generar un informe para un director de área, seguramente con un buen gráfico le va a ser mucho más fácil sacar conclusiones que con una hoja de Excel gigante.

En este ejemplo lo veremos de una forma más sencilla.

Tenemos este conjunto de datos sacados de un archivo .csv, y el mismo contiene características sobre casas, el precio, el número de habitaciones, de baños y una serie de características más.

Es cierto que mostrando este conjunto de datos somos capaces de sacar conclusiones o sacar algún tipo de valor.

Aprende las técnicas más avanzadas en análisis de datos
Comienza 15 días gratis en OpenWebinars y accede cursos, talleres y laboratorios prácticos de Hadoop, Spark, Power BI, Pandas, R y más.
Comenzar gratis ahora

Por ejemplo, si queremos mostrar cuántos dormitorios tiene la casa con el precio máximo y la casas con el precio mínimo, podremos empezar a buscar entre los datos de las casas y localizar ambos resultados.

Pero, ¿qué ocurre si en lugar de ese conjunto de datos, mostramos este gráfico y queremos saber cuántos dormitorios tiene la casa con el precio máximo y la casa con el precio mínimo? De un vistazo somos capaces directamente de saber qué número de habitaciones tienen las casas de mayor y menor precio, gracias a que las barras son mucho más fáciles de interpretar que un conjunto de datos en texto plano.

Importancia del color

El color en la visualización de datos es también muy importante. Veamos unos ejemplos.

En esta gráfica estamos representando dos variables, pero, además del hecho de no tener ninguna leyenda que nos diga qué variables se están representando, aunque la tuviéramos, ambas están en azul, poco podemos saber.

Si cada variable la representamos de un color distinto y añadimos una leyenda, la calidad del gráfico aumenta considerablemente.

Calidad de los gráficos

La calidad de un gráfico se suele basar en muchas características, de las que destacaremos las siguientes:

  • Los valores de los ejes: Por ejemplo, en la gráfica anterior, en el eje X únicamente tenemos marcados los números de habitaciones 0, 2, 4, 6 y 8, cuando también existen números de habitaciones como 1, 3 o 5. Si en nuestro gráfico mostramos en ese eje todos los valores, el gráfico estará ganando calidad.

  • Título: Con un título añadimos información sobre qué estamos representando en el gráfico, lo que ayuda a tener más información sobre los datos representados.

  • Leyenda: Una leyenda siempre ayuda mucho a la hora de entender o comprender el gráfico.

Un ejemplo de un gráfico que cumple estas tres características fundamentales es el siguiente:

Analiza los datos para tomar mejores decisiones en tu empresa
Cursos y talleres para formar a tus científicos de datos e ingenieros en las herramientas más utilizadas: Hadoop, Spark, Power BI, Pandas, R y más
Solicitar más información

Librerías para la creación de gráficos

Para acabar, destacamos algunas de las librerías que están relacionadas o que pueden ser usadas para la creación de gráficos con Python:

  • Matplotlib
  • Seaborn
  • Bokeh
  • Altair

Las cookies nos permiten ofrecer nuestros servicios. Al utilizar nuestros servicios, aceptas el uso que hacemos de las cookies. Más Información