Aan de slagGa gratis aan de slag

Rollende kwantielen voor dagelijkse luchtkwaliteit in NYC

Je hebt in de vorige video geleerd hoe je rollende kwantielen berekent om veranderingen in de spreiding van een tijdreeks in de tijd te beschrijven, op een manier die minder gevoelig is voor uitschieters dan met het gemiddelde en de standaarddeviatie.

Laten we rollende kwantielen berekenen — op 10%, 50% (mediaan) en 90% — van de verdeling van de dagelijkse gemiddelde ozonconcentratie in NYC met een rollend venster van 360 dagen.

Deze oefening maakt deel uit van de cursus

Tijdreeksgegevens manipuleren in Python

Cursus bekijken

Oefeninstructies

We hebben pandas al geïmporteerd als pd en matplotlib.pyplot als plt. We hebben ook de ozongegevens van 2000–2017 geladen in de variabele data.

  • Pas .resample() met dagelijkse frequentie 'D' toe op data en gebruik .interpolate() om missende waarden op te vullen, en wijs het resultaat opnieuw toe aan data.
  • Inspecteer het resultaat met .info().
  • Maak een .rolling()-venster met 360 periodes, selecteer de kolom 'Ozone', en ken het resultaat toe aan rolling.
  • Voeg drie nieuwe kolommen 'q10', 'q50' en 'q90' toe aan data en bereken de overeenkomstige kwantielen vanuit rolling.
  • Plot data.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Resample, interpolate and inspect ozone data here
data = ____


# Create the rolling window
rolling = ____

# Insert the rolling quantiles to the monthly returns
data['q10'] = ____
data['q50'] = ____
data['q90'] = ____

# Plot the data


Code bewerken en uitvoeren