Vergleich mit zwei KDEs
Stell dir vor, du arbeitest beim führenden Anbieter von Luftfiltern. Dein Unternehmen hat dich gebeten, einen Bericht zu erstellen, der untersucht, warum 2012 ein besonders gutes Jahr für den Verkauf eurer Ozonfilter (O3) war. Du hast hilfreiche Verschmutzungsdaten vom USGS heruntergeladen und möchtest eine prägnante Visualisierung erstellen, die das allgemeine Muster der O3-Belastung im Jahr 2012 mit allen anderen Jahren in den Aufzeichnungen vergleicht.
Dafür kannst du zwei überlagerte Kernel-Dichte-Schätzungen (KDEs) bauen: eine für die O3-Daten aus 2012 und eine für alle anderen Jahre.
Diese Übung ist Teil des Kurses
<Kurs>So verbesserst du deine Datenvisualisierungen in Python</Kurs>Übungsanweisungen
- Filtere die Daten im ersten
sns.kdeplot()-Aufruf so, dass nur das Jahr2012enthalten ist. - Färbe die Fläche unter der ersten KDE mit dem Argument
shadeein. - Füge für die Legende das Label
'2012'hinzu. - Wiederhole die ersten drei Schritte für den zweiten
sns.kdeplot()-Aufruf, filtere die Daten diesmal jedoch so, dass2012nicht enthalten ist. Verwende das Label'other years'.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Filter dataset to the year 2012
sns.kdeplot(pollution[pollution.year ____ ____].O3,
# Shade under kde and add a helpful label
shade = ____,
____ = '____')
# Filter dataset to everything except the year 2012
sns.kdeplot(pollution[pollution.year ____ ____].O3,
# Again, shade under kde and add a helpful label
shade = ____,
____ = '____')
plt.show()