Aan de slagGa gratis aan de slag

Data-analyse - geboortecijfer

Nu ga je je nieuwe vaardigheden gebruiken om zorgvuldig een SARIMA-model te fitten op de tijdreeks birth uit astsa. De data zijn maandelijks aantal levendgeborenen (gecorrigeerd) in duizenden voor de Verenigde Staten, 1948-1979, en omvatten de babyboom na WOII.

De birth-data zijn geplot in je R-console. Let op de langetermijntrend (random walk) en de seizoenscomponent in de data.

Deze oefening maakt deel uit van de cursus

ARIMA-modellen in R

Cursus bekijken

Oefeninstructies

  • Gebruik diff() om de data te differentiëren (d_birth). Gebruik acf2() om de steekproef-ACF en -PACF van deze data tot en met lag 60 te bekijken. Let op de seizoensmatige persistentie.
  • Gebruik nogmaals diff() om het seizoensverschil van de data te nemen. Sla dit op als dd_birth. Gebruik opnieuw acf2() om de ACF en PACF van deze data te bekijken, weer tot en met lag 60. Concludeer dat een SARIMA(0,1,1)x(0,1,1)12-model redelijk lijkt.
  • Fit het SARIMA(0,1,1)x(0,1,1)12-model. Wat gebeurt er?
  • Voeg een extra AR-parameter toe (niet-seizoensgebonden, p = 1) om extra correlatie te modelleren. Past het model goed?

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Plot P/ACF to lag 60 of differenced data
d_birth <- diff(birth)


# Plot P/ACF to lag 60 of seasonal differenced data
dd_birth <- diff(d_birth, lag = 12)


# Fit SARIMA(0,1,1)x(0,1,1)_12. What happens?


# Add AR term and conclude

Code bewerken en uitvoeren