Constante vulling
Constante vulling is een handige imputatiemethode als je ervan uit kunt gaan dat ontbrekende NA-waarden in een gegevensset een bepaalde vaste waarde moeten hebben. Soms raken bij het verplaatsen van data tussen verschillende platforms en software bepaalde waarden in de data ‘kwijt’ of worden ze onterecht als NA gemarkeerd. Met constante vulling kun je deze ontbrekende waarden vervangen door een standaardwaarde.
In deze oefening imputeer je ontbrekende waarden voor de tijdreeks car_sales, die de dagelijkse autoverkopen van een medewerker bij een autodealer weergeeft.
Deze oefening maakt deel uit van de cursus
Tijdreeksgegevens bewerken in R
Oefeninstructies
Bepaal het totale aantal
NA-waarden in de tijdreekscar_sales.Gebruik constante vulling om de ontbrekende waarden van
car_salesop te vullen met0; wijs dit toe aan de variabelecar_sales_filled.Maak een autoplot van de tijdreeks
car_sales_filled.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Add together the number of NA values
___
# Fill in missing values with zero
___ <- ___
# Autoplot the filled time series
autoplot(___) +
labs(y = "Daily Car Sales") +
theme_light()