Imputaties evalueren en vergelijken
Als je een imputatiemodel opstelt, is het een goed idee dit te vergelijken met een andere methode. In deze les vergelijken we de eerder geïmputeerde gegevensset die is gemaakt met impute_lm() met de gemiddelde-imputatiegegevensset. Beide gegevenssets zijn in deze oefening opgenomen als respectievelijk ocean_imp_lm_wind en ocean_imp_mean.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in R
Oefeninstructies
- Voeg de modellen samen met
bind_rows(), plaats het modelocean_imp_meanondermeanenocean_imp_lm_windonderlm_wind. - Bekijk de waarden van
air_tempenhumidityin een spreidingsdiagram, zetair_temp_cop de x-as,humidityop de y-as, kleur op eventuele missings, en facet op het gebruikte imputatiemodel (imp_model).
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Bind the models together
bound_models <- bind_rows(mean = ___,
lm_wind = ___,
.id = "imp_model")
# Inspect the values of air_temp and humidity as a scatter plot
ggplot(___,
aes(x = ___,
y = ___,
color = any_missing)) +
geom_point() +
facet_wrap(~___)