Rollierende 360-Tage-Median- und Standardabweichung für NYC-Ozon-Daten seit 2000
Im letzten Video hast du auch gesehen, wie du mit der Methode .agg() mehrere rollierende Statistiken berechnest, ähnlich wie mit .groupby().
Schauen wir uns die Luftqualitätsgeschichte von NYC anhand der Ozon-Daten, die du bereits gesehen hast, genauer an. Die Tagesdaten sind sehr volatil, daher kann ein längerfristiger rollierender Durchschnitt helfen, einen langfristigen Trend sichtbar zu machen.
Du verwendest ein 360-Tage-Fenster und .agg(), um den rollierenden Mittelwert und die Standardabweichung für die täglichen durchschnittlichen Ozonwerte seit 2000 zu berechnen.
Diese Übung ist Teil des Kurses
Zeitreihen in Python bearbeiten
Anleitung zur Übung
Wir haben pandas bereits als pd und matplotlib.pyplot als plt importiert.
- Verwende
pd.read_csv(), um'ozone.csv'zu importieren, erstelle mitparse_datesundindex_colaus der Spalte'date'einenDateTimeIndex, weise das Ergebnisdatazu und entferne fehlende Werte mit.dropna(). - Wähle die Spalte
'Ozone'aus, erstelle ein.rolling()-Fenster mit 360 Perioden, wende.agg()an, ummeanundstdzu berechnen, und weise das Ergebnisrolling_statszu. - Verwende
.join(), umdatamitrolling_statszu verketten, und weise das Ergebnisstatszu. - Plotte
statsmitsubplots.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import and inspect ozone data here
data = ____
# Calculate the rolling mean and std here
rolling_stats = ____
# Join rolling_stats with ozone data
stats = ____
# Plot stats