Data-analyse - geboortecijfer
Nu ga je je nieuwe vaardigheden gebruiken om zorgvuldig een SARIMA-model te fitten op de tijdreeks birth uit astsa. De data zijn maandelijks aantal levendgeborenen (gecorrigeerd) in duizenden voor de Verenigde Staten, 1948-1979, en omvatten de babyboom na WOII.
De birth-data zijn geplot in je R-console. Let op de langetermijntrend (random walk) en de seizoenscomponent in de data.
Deze oefening maakt deel uit van de cursus
ARIMA-modellen in R
Oefeninstructies
- Gebruik
diff()om de data te differentiëren (d_birth). Gebruikacf2()om de steekproef-ACF en -PACF van deze data tot en met lag 60 te bekijken. Let op de seizoensmatige persistentie. - Gebruik nogmaals
diff()om het seizoensverschil van de data te nemen. Sla dit op alsdd_birth. Gebruik opnieuwacf2()om de ACF en PACF van deze data te bekijken, weer tot en met lag 60. Concludeer dat een SARIMA(0,1,1)x(0,1,1)12-model redelijk lijkt. - Fit het SARIMA(0,1,1)x(0,1,1)12-model. Wat gebeurt er?
- Voeg een extra AR-parameter toe (niet-seizoensgebonden,
p = 1) om extra correlatie te modelleren. Past het model goed?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Plot P/ACF to lag 60 of differenced data
d_birth <- diff(birth)
# Plot P/ACF to lag 60 of seasonal differenced data
dd_birth <- diff(d_birth, lag = 12)
# Fit SARIMA(0,1,1)x(0,1,1)_12. What happens?
# Add AR term and conclude