Saisonbereinigung in der Steuersaison
Viele Zeitreihen zeigen ein starkes saisonales Verhalten. Das Verfahren zum Entfernen der saisonalen Komponente einer Zeitreihe heißt Saisonbereinigung. Zum Beispiel sind die meisten von staatlichen Behörden veröffentlichten Wirtschaftsdaten saisonbereinigt.
Du hast zuvor gesehen: Wenn du bei einer Random-Walk-Reihe die erste Differenz bildest, erhältst du einen stationären White-Noise-Prozess. Für Saisonbereinigungen nimmst du statt der ersten Differenz eine Differenz mit einem Lag, das der Periodizität entspricht.
Schau dir noch einmal die ACF der quartalsweisen Gewinne von H&R Block an, die im DataFrame HRB vorab geladen sind: Es gibt eine klare saisonale Komponente. Die Autokorrelation ist für Lags 4, 8, 12, 16, … hoch, weil die Gewinne während der Steuersaison alle vier Quartale einen Ausschlag haben. Wende eine Saisonbereinigung an, indem du die vierte Differenz bildest (vier entspricht der Periodizität der Reihe). Berechne anschließend die Autokorrelation der transformierten Reihe.
Diese Übung ist Teil des Kurses
Zeitreihenanalyse in Python
Anleitung zur Übung
- Erstelle einen neuen DataFrame mit saisonbereinigten Gewinnen, indem du die Differenz mit Lag 4 der Quartalsgewinne mit der Methode
.diff()bildest. - Untersuche die ersten 10 Zeilen des saisonbereinigten DataFrames und beachte, dass die ersten vier Zeilen
NaNsind. - Entferne die
NaN-Zeilen mit der Methode.dropna(). - Zeichne die Autokorrelationsfunktion des saisonbereinigten DataFrames.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import the plot_acf module from statsmodels
from statsmodels.graphics.tsaplots import plot_acf
# Seasonally adjust quarterly earnings
HRBsa = ___
# Print the first 10 rows of the seasonally adjusted series
print(HRBsa.___)
# Drop the NaN data in the first four rows
HRBsa = ___
# Plot the autocorrelation function of the seasonally adjusted series
plot_acf(HRBsa)
plt.show()