Elegir la variable adecuada para codificar con color
Tu tarea es visualizar los valores de contaminación de Long Beach y ciudades cercanas a lo largo del tiempo. El código proporcionado genera el siguiente gráfico (difícil de leer), que muestra los valores máximos de contaminación (disponibles como max_pollutant_values) con las barras coloreadas por ciudad.

Puedes mejorarlo rápidamente con unos pocos ajustes. Si limitas las ciudades mostradas solo a las de la mitad occidental del país, evitarás el desorden visual. Después, si cambias la codificación del color de city a year, podrás usar una paleta ordinal, evitando que la persona lectora tenga que consultar constantemente la leyenda para comprobar qué color corresponde a cada ciudad.
Este ejercicio forma parte del curso
Mejora tus visualizaciones de datos en Python
Instrucciones del ejercicio
- Elimina
'Indianapolis','Des Moines','Cincinnati','Houston'del vectorcities. - Intercambia las codificaciones de las variables
cityyyear. - Usa la paleta de ColorBrewer
'BuGn'para asignar los colores de forma adecuada a la nueva variable ordinal.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Reduce to just cities in the western half of US
cities = ['Fairbanks', 'Long Beach', 'Vandenberg Air Force Base', 'Denver',
'Indianapolis', 'Des Moines', 'Cincinnati', 'Houston']
# Filter data to desired cities
city_maxes = max_pollutant_values[max_pollutant_values.city.isin(cities)]
# Swap city and year encodings
sns.catplot(x = 'year', hue = 'city',
y = 'value', row = 'pollutant',
# Change palette to one appropriate for ordinal categories
data = city_maxes, palette = 'muted',
sharey = False, kind = 'bar')
plt.show()