Imputaties beoordelen (meerdere modellen & variabelen)
Als je een imputatiemodel opbouwt, is het een goed idee om het te vergelijken met een andere methode.
In deze les ga je een laatste imputatiemodel toevoegen dat een extra, nuttig stuk informatie bevat dat helpt om een deel van de variatie in de data te verklaren. Daarna ga je de waarden vergelijken, net zoals je in de vorige les hebt gedaan.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in R
Oefeninstructies
Gebruik de oceanbuoys-gegevensset:
- Imputeer data met
impute_lm(), en voegyeartoe aan het model. - Bind de imputatiemethoden samen, waarbij je
ocean_imp_meaninmeanplaatst,ocean_imp_lm_windinlm_wind, enocean_imp_lm_wind_yearinlm_wind_year. - Bekijk de waarden van
air_temp_c(op de x-as) enhumidity(op de y-as), kleur op aanwezigheid van missings, en facet op imputatiemodel.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Build a model adding year to the outcome
ocean_imp_lm_wind_year <- bind_shadow(___) %>%
impute_lm(air_temp_c ~ wind_ew + wind_ns + ___) %>%
impute_lm(humidity ~ wind_ew + wind_ns + ___) %>%
add_label_shadow()
# Bind the mean, lm_wind, and lm_wind_year models together
bound_models <- bind_rows(mean = ocean_imp_mean,
lm_wind = ocean_imp_lm_wind,
lm_wind_year = ___,
.id = "imp_model")
# Explore air_temp and humidity, coloring by any missings, and faceting by imputation model
ggplot(___, aes(x = ___, y = ___, color = any_missing)) +
geom_point() + facet_wrap(~___)