Rollende mediaan en standaarddeviatie over 360 dagen voor NY-ozongegevens sinds 2000
In de laatste video zag je ook hoe je meerdere rollende statistieken kunt berekenen met de methode .agg(), vergelijkbaar met .groupby().
Laten we de luchtkwaliteitsgeschiedenis van NYC nader bekijken met de ozongegevens die je al hebt gezien. De dagelijkse gegevens zijn erg volatiel, dus een langetermijn rollend gemiddelde kan helpen om een langetermijntrend zichtbaar te maken.
Je gebruikt een rollend venster van 360 dagen en .agg() om het rollend gemiddelde en de standaarddeviatie te berekenen voor de dagelijkse gemiddelde ozonwaarden sinds 2000.
Deze oefening maakt deel uit van de cursus
Tijdreeksgegevens manipuleren in Python
Oefeninstructies
We hebben pandas al geïmporteerd als pd, en matplotlib.pyplot als plt.
- Gebruik
pd.read_csv()om'ozone.csv'te importeren, maak eenDateTimeIndexvan de kolom'date'metparse_datesenindex_col, ken het resultaat toe aandata, en verwijder ontbrekende waarden met.dropna(). - Selecteer de kolom
'Ozone'en maak een.rolling()-venster met 360 periodes, pas.agg()toe om demeanenstdte berekenen, en ken dit toe aanrolling_stats. - Gebruik
.join()omdatate concatenaten metrolling_stats, en ken dit toe aanstats. - Plot
statsmetsubplots.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import and inspect ozone data here
data = ____
# Calculate the rolling mean and std here
rolling_stats = ____
# Join rolling_stats with ozone data
stats = ____
# Plot stats