Imputationen bewerten und vergleichen
Wenn du ein Imputationsmodell erstellst, ist es eine gute Idee, es mit einer anderen Methode zu vergleichen. In dieser Lektion vergleichen wir den zuvor mit impute_lm() erstellten imputierten Datensatz mit dem mittleren imputierten Datensatz. Beide Datensätze sind in dieser Übung enthalten, als ocean_imp_lm_wind bzw. ocean_imp_mean.
Diese Übung ist Teil des Kurses
Umgang mit fehlenden Daten in R
Anleitung zur Übung
- Führe die Modelle mit
bind_rows()zusammen, wobei du das Modellocean_imp_meanuntermeanundocean_imp_lm_windunterlm_windablegst. - Betrachte die Werte von
air_tempundhumidityin einem Scatterplot: platziereair_temp_cauf der x-Achse,humidityauf der y-Achse, färbe nach vorhandenen Missing-Werten und facettiere nach dem verwendeten Imputationsmodell (imp_model).
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Bind the models together
bound_models <- bind_rows(mean = ___,
lm_wind = ___,
.id = "imp_model")
# Inspect the values of air_temp and humidity as a scatter plot
ggplot(___,
aes(x = ___,
y = ___,
color = any_missing)) +
geom_point() +
facet_wrap(~___)