Ontbrekende data vervangen - II
Zoals bij veel aspecten van tijdreeksmanipulatie zijn er meerdere manieren om met ontbrekende waarden om te gaan. Zoals je in de vorige oefening hebt gezien, vereisen zowel de locf- als de nocb-aanpak dat je bepaalde aannames doet over groeipatronen in je data. Terwijl locf voorzichtiger is en nocb wat agressiever, leveren beide stapgewijze groei op vanuit ontbrekende data.
Maar wat als je reden hebt om lineaire groei in je data te verwachten? In dat geval is lineaire interpolatie vaak handiger. Daarbij worden nieuwe waarden tussen de bekende datapunten aan weerszijden van de ontbrekende waarde berekend, gewogen naar tijd.
In deze oefening vul je de ontbrekende waarden in je gdp_xts-data aan met het commando na.approx(), dat via interpolatie lineaire waarden in de tijd schat.
Deze oefening maakt deel uit van de cursus
Casestudy: Tijdreeksgegevens van een stad analyseren in R
Oefeninstructies
- Gebruik
na.approx()om de ontbrekende waarden ingdp_xtsop te vullen met lineaire interpolatie. Sla dit nieuwe xts-object op alsgdp_approx. - Plot je nieuwe xts-object met
plot.xts(). - Vraag in je nieuwe xts-object het bbp voor 1993 op.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Fill NAs in gdp_xts using linear approximation
gdp_approx <-
# Plot your new xts object
plot.xts(___, major.format = "%Y")
# Query for GDP in 1993 in gdp_approx