Aan de slagGa gratis aan de slag

Rollende mediaan en standaarddeviatie over 360 dagen voor NY-ozongegevens sinds 2000

In de laatste video zag je ook hoe je meerdere rollende statistieken kunt berekenen met de methode .agg(), vergelijkbaar met .groupby().

Laten we de luchtkwaliteitsgeschiedenis van NYC nader bekijken met de ozongegevens die je al hebt gezien. De dagelijkse gegevens zijn erg volatiel, dus een langetermijn rollend gemiddelde kan helpen om een langetermijntrend zichtbaar te maken.

Je gebruikt een rollend venster van 360 dagen en .agg() om het rollend gemiddelde en de standaarddeviatie te berekenen voor de dagelijkse gemiddelde ozonwaarden sinds 2000.

Deze oefening maakt deel uit van de cursus

Tijdreeksgegevens manipuleren in Python

Cursus bekijken

Oefeninstructies

We hebben pandas al geïmporteerd als pd, en matplotlib.pyplot als plt.

  • Gebruik pd.read_csv() om 'ozone.csv' te importeren, maak een DateTimeIndex van de kolom 'date' met parse_dates en index_col, ken het resultaat toe aan data, en verwijder ontbrekende waarden met .dropna().
  • Selecteer de kolom 'Ozone' en maak een .rolling()-venster met 360 periodes, pas .agg() toe om de mean en std te berekenen, en ken dit toe aan rolling_stats.
  • Gebruik .join() om data te concatenaten met rolling_stats, en ken dit toe aan stats.
  • Plot stats met subplots.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import and inspect ozone data here
data = ____

# Calculate the rolling mean and std here
rolling_stats = ____

# Join rolling_stats with ozone data
stats = ____

# Plot stats


Code bewerken en uitvoeren