Rollende kwantielen voor dagelijkse luchtkwaliteit in NYC
Je hebt in de vorige video geleerd hoe je rollende kwantielen berekent om veranderingen in de spreiding van een tijdreeks in de tijd te beschrijven, op een manier die minder gevoelig is voor uitschieters dan met het gemiddelde en de standaarddeviatie.
Laten we rollende kwantielen berekenen — op 10%, 50% (mediaan) en 90% — van de verdeling van de dagelijkse gemiddelde ozonconcentratie in NYC met een rollend venster van 360 dagen.
Deze oefening maakt deel uit van de cursus
Tijdreeksgegevens manipuleren in Python
Oefeninstructies
We hebben pandas al geïmporteerd als pd en matplotlib.pyplot als plt. We hebben ook de ozongegevens van 2000–2017 geladen in de variabele data.
- Pas
.resample()met dagelijkse frequentie'D'toe opdataen gebruik.interpolate()om missende waarden op te vullen, en wijs het resultaat opnieuw toe aandata. - Inspecteer het resultaat met
.info(). - Maak een
.rolling()-venster met 360 periodes, selecteer de kolom'Ozone', en ken het resultaat toe aanrolling. - Voeg drie nieuwe kolommen
'q10','q50'en'q90'toe aandataen bereken de overeenkomstige kwantielen vanuitrolling. - Plot
data.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Resample, interpolate and inspect ozone data here
data = ____
# Create the rolling window
rolling = ____
# Insert the rolling quantiles to the monthly returns
data['q10'] = ____
data['q50'] = ____
data['q90'] = ____
# Plot the data