Lineaire interpolatie
Voor continue en numerieke data – waarbij waarden overal binnen een bereik kunnen vallen – is lineaire interpolatie vaak de beste optie voor imputatie. Gegevens zoals temperatuur, hoogte en inkomen per hoofd van de bevolking zijn voorbeelden waar lineaire interpolatie gebruikt kan worden.
In deze oefening bepaal je het aantal ontbrekende waarden in de tijdreeks maunaloa_missing en gebruik je lineaire interpolatie om deze waarden te imputeren.
maunaloa_missing, zoo en ggplot2 zijn voor je beschikbaar.
Deze oefening maakt deel uit van de cursus
Tijdreeksgegevens bewerken in R
Oefeninstructies
Bepaal het aantal waarnemingen uit
maunaloa_missingdieNAzijn.Gebruik lineaire interpolatie om de ontbrekende waarden in
maunaloa_missingop te vullen; sla dit op alsmaunaloa_linear.Maak een
ggplotvanmaunaloa_linearmet een rode lijn.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Count the number of missing values
___
# Fill in values with linear approximation
___
# Generate a full ggplot of maunaloa_linear
ggplot(___,
aes(___)) +
scale_y_continuous() +
___