Diagnostiek - gesimuleerde overfitting
Een manier om je analyse te controleren is het model bewust te overfitten door een extra parameter toe te voegen, en te kijken of dat de resultaten beïnvloedt. Als het toevoegen van parameters de resultaten sterk verandert, dan moet je je model heroverwegen. Als de resultaten echter nauwelijks veranderen, kun je er vertrouwen in hebben dat je fit goed is.
We hebben 250 waarnemingen gegenereerd uit een ARIMA(0,1,1)-model met een MA-parameter van .9. Eerst pas je het model op de data toe met de gebruikelijke technieken.
Vervolgens kun je het model controleren door te overfitten (een parameter toe te voegen) om te zien of dat uitmaakt. In dit geval voeg je een extra MA-parameter toe om te laten zien dat die niet nodig is.
Zoals gebruikelijk is het pakket astsa al geladen en zijn de gegenereerde data in x voor je geplot. De gedifferentieerde data diff(x) zijn ook geplot. Merk op dat deze er stationair uitzien.
Deze oefening maakt deel uit van de cursus
ARIMA-modellen in R
Oefeninstructies
- Plot de voorbeeld-ACF en -PACF van de gedifferentieerde data met
acf2()en let erop dat het model gemakkelijk te identificeren is. - Pas een ARIMA(0,1,1)-model toe op de gesimuleerde data met
sarima(). Vergelijk de schatting van de MA-parameter met de werkelijke waarde van .9 en bekijk de residuplots. - Overfit het model door een extra MA-parameter toe te voegen. Dus: pas een ARIMA(0,1,2) toe op de data en vergelijk die met de ARIMA(0,1,1)-run.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Plot sample P/ACF pair of the differenced data
# Fit the first model, compare parameters, check diagnostics
# Fit the second model and compare fit