ComenzarEmpieza gratis

Elegir la variable adecuada para codificar con color

Tu tarea es visualizar los valores de contaminación de Long Beach y ciudades cercanas a lo largo del tiempo. El código proporcionado genera el siguiente gráfico (difícil de leer), que muestra los valores máximos de contaminación (disponibles como max_pollutant_values) con las barras coloreadas por ciudad.

Mutlicolor and busy bar plots with four rows corresponding to the four pollutants in dataset

Puedes mejorarlo rápidamente con unos pocos ajustes. Si limitas las ciudades mostradas solo a las de la mitad occidental del país, evitarás el desorden visual. Después, si cambias la codificación del color de city a year, podrás usar una paleta ordinal, evitando que la persona lectora tenga que consultar constantemente la leyenda para comprobar qué color corresponde a cada ciudad.

Este ejercicio forma parte del curso

Mejora tus visualizaciones de datos en Python

Ver curso

Instrucciones del ejercicio

  • Elimina 'Indianapolis', 'Des Moines', 'Cincinnati', 'Houston' del vector cities.
  • Intercambia las codificaciones de las variables city y year.
  • Usa la paleta de ColorBrewer 'BuGn' para asignar los colores de forma adecuada a la nueva variable ordinal.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Reduce to just cities in the western half of US
cities = ['Fairbanks', 'Long Beach', 'Vandenberg Air Force Base', 'Denver', 
          'Indianapolis', 'Des Moines', 'Cincinnati', 'Houston']

# Filter data to desired cities
city_maxes = max_pollutant_values[max_pollutant_values.city.isin(cities)]

# Swap city and year encodings
sns.catplot(x = 'year', hue = 'city',
              y = 'value', row = 'pollutant',    
              # Change palette to one appropriate for ordinal categories
              data = city_maxes, palette = 'muted',
              sharey = False, kind = 'bar')
plt.show()
Editar y ejecutar código