Curso de tratamiento de datos con Pandas
¿Ya te manejas con Python y quieres seguir avanzando para ser un profesional del procesamiento de datos? Entonces...
Un científico de datos o cualquiera que trabaje con datos, tiene siempre que intentar mostrar los resultados de la manera más bonita y, sobre todo, más fácil de interpretar para aquel que lo vaya a usar.
Si, por ejemplo, tenemos que generar un informe para un director de área, seguramente con un buen gráfico le va a ser mucho más fácil sacar conclusiones que con una hoja de Excel gigante.
En este ejemplo lo veremos de una forma más sencilla.
Tenemos este conjunto de datos sacados de un archivo .csv, y el mismo contiene características sobre casas, el precio, el número de habitaciones, de baños y una serie de características más.
Es cierto que mostrando este conjunto de datos somos capaces de sacar conclusiones o sacar algún tipo de valor.
Por ejemplo, si queremos mostrar cuántos dormitorios tiene la casa con el precio máximo y la casas con el precio mínimo, podremos empezar a buscar entre los datos de las casas y localizar ambos resultados.
Pero, ¿qué ocurre si en lugar de ese conjunto de datos, mostramos este gráfico y queremos saber cuántos dormitorios tiene la casa con el precio máximo y la casa con el precio mínimo? De un vistazo somos capaces directamente de saber qué número de habitaciones tienen las casas de mayor y menor precio, gracias a que las barras son mucho más fáciles de interpretar que un conjunto de datos en texto plano.
El color en la visualización de datos es también muy importante. Veamos unos ejemplos.
En esta gráfica estamos representando dos variables, pero, además del hecho de no tener ninguna leyenda que nos diga qué variables se están representando, aunque la tuviéramos, ambas están en azul, poco podemos saber.
Si cada variable la representamos de un color distinto y añadimos una leyenda, la calidad del gráfico aumenta considerablemente.
Calidad de los gráficos
La calidad de un gráfico se suele basar en muchas características, de las que destacaremos las siguientes:
Los valores de los ejes: Por ejemplo, en la gráfica anterior, en el eje X únicamente tenemos marcados los números de habitaciones 0, 2, 4, 6 y 8, cuando también existen números de habitaciones como 1, 3 o 5. Si en nuestro gráfico mostramos en ese eje todos los valores, el gráfico estará ganando calidad.
Título: Con un título añadimos información sobre qué estamos representando en el gráfico, lo que ayuda a tener más información sobre los datos representados.
Leyenda: Una leyenda siempre ayuda mucho a la hora de entender o comprender el gráfico.
Un ejemplo de un gráfico que cumple estas tres características fundamentales es el siguiente:
Para acabar, destacamos algunas de las librerías que están relacionadas o que pueden ser usadas para la creación de gráficos con Python:
También te puede interesar
¿Ya te manejas con Python y quieres seguir avanzando para ser un profesional del procesamiento de datos? Entonces...
Descubre el fascinante mundo del lenguaje de programación que funciona como una auténtica navaja suiza cuando se trata...
Con este curso de NumPy con Python aprenderás a tratar datos utilizando para ello la librería de Python...