Imputationen bewerten (viele Modelle & Variablen)
Wenn du ein Imputationsmodell erstellst, ist es eine gute Idee, es mit einer anderen Methode zu vergleichen.
In dieser Lektion fügst du ein letztes Imputationsmodell hinzu, das ein zusätzliches nützliches Merkmal enthält, das einen Teil der Variation in den Daten erklärt. Anschließend vergleichst du die Werte – so wie in der letzten Lektion.
Diese Übung ist Teil des Kurses
Umgang mit fehlenden Daten in R
Anleitung zur Übung
Verwende den Datensatz oceanbuoys:
- Imputiere Daten mit
impute_lm()und fügeyearzum Modell hinzu. - Fasse die Imputationsmethoden zusammen, wobei
ocean_imp_meaninmean,ocean_imp_lm_windinlm_windundocean_imp_lm_wind_yearinlm_wind_yearüberführt wird. - Betrachte die Werte von
air_temp_c(auf der x-Achse) undhumidity(auf der y-Achse), färbe nach vorhandenen Missings und facettiere nach Imputationsmodell.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Build a model adding year to the outcome
ocean_imp_lm_wind_year <- bind_shadow(___) %>%
impute_lm(air_temp_c ~ wind_ew + wind_ns + ___) %>%
impute_lm(humidity ~ wind_ew + wind_ns + ___) %>%
add_label_shadow()
# Bind the mean, lm_wind, and lm_wind_year models together
bound_models <- bind_rows(mean = ocean_imp_mean,
lm_wind = ocean_imp_lm_wind,
lm_wind_year = ___,
.id = "imp_model")
# Explore air_temp and humidity, coloring by any missings, and faceting by imputation model
ggplot(___, aes(x = ___, y = ___, color = any_missing)) +
geom_point() + facet_wrap(~___)