IniziaInizia gratis

Scegliere la variabile giusta da codificare con il colore

Ti è stato chiesto di visualizzare i valori di inquinamento per Long Beach e le città vicine nel tempo. Il codice fornito genera il grafico qui sotto (difficile da leggere), che mostra i valori massimi di inquinamento (forniti come max_pollutant_values) con le barre colorate in base alla città.

Mutlicolor and busy bar plots with four rows corresponding to the four pollutants in dataset

Puoi migliorarlo rapidamente con pochi accorgimenti. Limitando le città mostrate solo a quelle nella metà occidentale del Paese eviterai il disordine. Poi, scambiando la codifica del colore da city a year potrai usare una palette ordinale, evitando al lettore di dover consultare continuamente la legenda per verificare quale colore corrisponde a quale città.

Questo esercizio fa parte del corso

Migliorare le tue visualizzazioni dei dati in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Rimuovi 'Indianapolis', 'Des Moines', 'Cincinnati', 'Houston' dal vettore cities.
  • Scambia le codifiche delle variabili city e year.
  • Usa la palette ColorBrewer 'BuGn' per mappare correttamente i colori sulla nuova variabile ordinale.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Reduce to just cities in the western half of US
cities = ['Fairbanks', 'Long Beach', 'Vandenberg Air Force Base', 'Denver', 
          'Indianapolis', 'Des Moines', 'Cincinnati', 'Houston']

# Filter data to desired cities
city_maxes = max_pollutant_values[max_pollutant_values.city.isin(cities)]

# Swap city and year encodings
sns.catplot(x = 'year', hue = 'city',
              y = 'value', row = 'pollutant',    
              # Change palette to one appropriate for ordinal categories
              data = city_maxes, palette = 'muted',
              sharey = False, kind = 'bar')
plt.show()
Modifica ed esegui il codice