Vergleich mit zwei KDEs
Stell dir vor, du arbeitest beim führenden Anbieter von Luftfiltern. Dein Unternehmen hat dich gebeten, einen Bericht zu erstellen, der untersucht, warum 2012 ein besonders gutes Jahr für den Verkauf eurer Ozonfilter (O3) war. Du hast hilfreiche Verschmutzungsdaten vom USGS heruntergeladen und möchtest eine prägnante Visualisierung erstellen, die das allgemeine Muster der O3-Belastung im Jahr 2012 mit allen anderen Jahren in den Aufzeichnungen vergleicht.
Dafür kannst du zwei überlagerte Kernel-Dichte-Schätzungen (KDEs) bauen: eine für die O3-Daten aus 2012 und eine für alle anderen Jahre.
Diese Übung ist Teil des Kurses
So verbesserst du deine Datenvisualisierungen in Python
Anleitung zur Übung
- Filtere die Daten im ersten
sns.kdeplot()-Aufruf so, dass nur das Jahr2012enthalten ist. - Färbe die Fläche unter der ersten KDE mit dem Argument
shadeein. - Füge für die Legende das Label
'2012'hinzu. - Wiederhole die ersten drei Schritte für den zweiten
sns.kdeplot()-Aufruf, filtere die Daten diesmal jedoch so, dass2012nicht enthalten ist. Verwende das Label'other years'.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Filter dataset to the year 2012
sns.kdeplot(pollution[pollution.year ____ ____].O3,
# Shade under kde and add a helpful label
shade = ____,
____ = '____')
# Filter dataset to everything except the year 2012
sns.kdeplot(pollution[pollution.year ____ ____].O3,
# Again, shade under kde and add a helpful label
shade = ____,
____ = '____')
plt.show()