Is temperatuur een random walk (met drift)?
Een ARMA-model is een eenvoudige aanpak om klimaatveranderingen te voorspellen, maar het laat wel veel van de onderwerpen zien die in deze cursus aan bod komen.
De DataFrame temp_NY bevat de gemiddelde jaarlijkse temperatuur in Central Park, NY van 1870–2016 (de data is gedownload van de NOAA hier). Plot de data en test of die een random walk (met drift) volgt.
Deze oefening maakt deel uit van de cursus
Tijdreeksanalyse in Python
Oefeninstructies
- Zet de index met jaren om naar een datetime-object met
pd.to_datetime(). Omdat de data jaarlijks is, geef je het argumentformat='%Y'mee. - Plot de data met
.plot() - Bereken de p-waarde van de Augmented Dickey-Fuller-test met de functie
adfuller. - Sla de resultaten van de ADF-test op in
resulten print de p-waarde inresult[1].
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the adfuller function from the statsmodels module
from statsmodels.tsa.stattools import adfuller
# Convert the index to a datetime object
temp_NY.index = pd.to_datetime(___.___, format=___)
# Plot average temperatures
temp_NY.___
plt.show()
# Compute and print ADF p-value
result = ___(temp_NY['TAVG'])
print("The p-value for the ADF test is ", result[1])