LoslegenKostenlos starten

Imputationen bewerten (viele Modelle & Variablen)

Wenn du ein Imputationsmodell erstellst, ist es eine gute Idee, es mit einer anderen Methode zu vergleichen.

In dieser Lektion fügst du ein letztes Imputationsmodell hinzu, das ein zusätzliches nützliches Merkmal enthält, das einen Teil der Variation in den Daten erklärt. Anschließend vergleichst du die Werte – so wie in der letzten Lektion.

Diese Übung ist Teil des Kurses

<Kurs>Umgang mit fehlenden Daten in R</Kurs>
Kurs ansehen

Übungsanweisungen

Verwende den Datensatz oceanbuoys:

  • Imputiere Daten mit impute_lm() und füge year zum Modell hinzu.
  • Fasse die Imputationsmethoden zusammen, wobei ocean_imp_mean in mean, ocean_imp_lm_wind in lm_wind und ocean_imp_lm_wind_year in lm_wind_year überführt wird.
  • Betrachte die Werte von air_temp_c (auf der x-Achse) und humidity (auf der y-Achse), färbe nach vorhandenen Missings und facettiere nach Imputationsmodell.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Build a model adding year to the outcome
ocean_imp_lm_wind_year <- bind_shadow(___) %>%
  impute_lm(air_temp_c ~ wind_ew + wind_ns + ___) %>%
  impute_lm(humidity ~ wind_ew + wind_ns + ___) %>%
  add_label_shadow()

# Bind the mean, lm_wind, and lm_wind_year models together
bound_models <- bind_rows(mean = ocean_imp_mean,
                          lm_wind = ocean_imp_lm_wind,
                          lm_wind_year = ___,
                          .id = "imp_model")

# Explore air_temp and humidity, coloring by any missings, and faceting by imputation model
ggplot(___, aes(x = ___, y = ___, color = any_missing)) + 
  geom_point() + facet_wrap(~___)
Code bearbeiten und ausführen