Die richtige Variable für die Farbkodierung wählen
Du sollst die Luftverschmutzungswerte für Long Beach und nahegelegene Städte im Zeitverlauf visualisieren. Der bereitgestellte Code erzeugt das untenstehende (schwer lesbare) Diagramm, das aus maximalen Verschmutzungswerten (bereitgestellt als max_pollutant_values) besteht, wobei die Balken nach Stadt eingefärbt sind.

Mit ein paar Anpassungen kannst du das schnell verbessern. Wenn du die angezeigten Städte auf diejenigen in der westlichen Hälfte der USA beschränkst, vermeidest du Unübersichtlichkeit. Außerdem ermöglicht das Tauschen der Farbkodierung von city auf year die Verwendung einer ordinalen Palette, sodass Leserinnen und Leser nicht ständig in die Legende schauen müssen, um zu prüfen, welche Farbe zu welcher Stadt gehört.
Diese Übung ist Teil des Kurses
So verbesserst du deine Datenvisualisierungen in Python
Anleitung zur Übung
- Entferne
'Indianapolis','Des Moines','Cincinnati','Houston'aus dem Vektorcities. - Tausche die Kodierungen der Variablen
cityundyear. - Verwende die ColorBrewer-Palette
'BuGn', um die Farben für die nun ordinale Variable passend abzubilden.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Reduce to just cities in the western half of US
cities = ['Fairbanks', 'Long Beach', 'Vandenberg Air Force Base', 'Denver',
'Indianapolis', 'Des Moines', 'Cincinnati', 'Houston']
# Filter data to desired cities
city_maxes = max_pollutant_values[max_pollutant_values.city.isin(cities)]
# Swap city and year encodings
sns.catplot(x = 'year', hue = 'city',
y = 'value', row = 'pollutant',
# Change palette to one appropriate for ordinal categories
data = city_maxes, palette = 'muted',
sharey = False, kind = 'bar')
plt.show()