MulaiMulai sekarang secara gratis

Memilih variabel yang tepat untuk dikodekan dengan warna

Anda diminta memvisualisasikan nilai polusi untuk Long Beach dan kota-kota terdekat dari waktu ke waktu. Kode yang disediakan menghasilkan plot (sulit dibaca) di bawah ini, yang terdiri dari nilai polusi maksimum (disediakan sebagai max_pollutant_values) dengan batang diwarnai berdasarkan kota.

Mutlicolor and busy bar plots with four rows corresponding to the four pollutants in dataset

Anda dapat segera memperbaikinya dengan beberapa penyesuaian. Dengan memodifikasi kota yang ditampilkan hanya ke kota-kota di bagian barat negara, Anda akan mengurangi kekacauan. Selanjutnya, menukar pengodean warna dari city ke year memungkinkan Anda menggunakan palet ordinal, sehingga pembaca tidak perlu terus-menerus merujuk ke legenda untuk mengecek warna mana yang sesuai dengan kota mana.

Latihan ini adalah bagian dari kursus

Meningkatkan Visualisasi Data Anda di Python

Lihat Kursus

Petunjuk latihan

  • Hapus 'Indianapolis', 'Des Moines', 'Cincinnati', 'Houston' dari vektor cities.
  • Tukar pengodean variabel city dan year.
  • Gunakan palet ColorBrewer 'BuGn' untuk memetakan warna Anda secara tepat untuk variabel ordinal yang baru.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Reduce to just cities in the western half of US
cities = ['Fairbanks', 'Long Beach', 'Vandenberg Air Force Base', 'Denver', 
          'Indianapolis', 'Des Moines', 'Cincinnati', 'Houston']

# Filter data to desired cities
city_maxes = max_pollutant_values[max_pollutant_values.city.isin(cities)]

# Swap city and year encodings
sns.catplot(x = 'year', hue = 'city',
              y = 'value', row = 'pollutant',    
              # Change palette to one appropriate for ordinal categories
              data = city_maxes, palette = 'muted',
              sharey = False, kind = 'bar')
plt.show()
Edit dan Jalankan Kode