Vergelijken met twee KDE's
Stel je voor dat je werkt voor de toonaangevende aanbieder van luchtfilters. Je bedrijf heeft je gevraagd een rapport te maken dat onderzoekt waarom 2012 een bijzonder goed jaar was voor de verkoop van je ozonfilter (O3). Je hebt nuttige vervuilingsdata gedownload van de USGS en je wilt een compacte visualisatie maken die het algemene patroon van O3-vervuiling in 2012 vergelijkt met alle andere jaren in de dataset.
Dit kun je doen door twee overlappende kernel-dichtheidsschattingen (KDE's) te maken: één voor O3-gegevens van 2012 en één voor alle andere jaren.
Deze oefening maakt deel uit van de cursus
Je datavisualisaties verbeteren in Python
Oefeninstructies
- Filter de data in de eerste aanroep van
sns.kdeplot()zodat die alleen het jaar2012bevat. - Kleur het gebied onder de eerste KDE in met het argument
shade. - Voeg het label
'2012'toe voor de legenda van de plot. - Herhaal de eerste drie stappen voor de tweede aanroep van
sns.kdeplot(), maar filter de data zodat2012niet wordt opgenomen. Gebruik het label'other years'.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Filter dataset to the year 2012
sns.kdeplot(pollution[pollution.year ____ ____].O3,
# Shade under kde and add a helpful label
shade = ____,
____ = '____')
# Filter dataset to everything except the year 2012
sns.kdeplot(pollution[pollution.year ____ ____].O3,
# Again, shade under kde and add a helpful label
shade = ____,
____ = '____')
plt.show()