LoslegenKostenlos loslegen

Imputationen bewerten (viele Modelle & Variablen)

Wenn du ein Imputationsmodell erstellst, ist es eine gute Idee, es mit einer anderen Methode zu vergleichen.

In dieser Lektion fügst du ein letztes Imputationsmodell hinzu, das ein zusätzliches nützliches Merkmal enthält, das einen Teil der Variation in den Daten erklärt. Anschließend vergleichst du die Werte – so wie in der letzten Lektion.

Diese Übung ist Teil des Kurses

Umgang mit fehlenden Daten in R

Kurs anzeigen

Anleitung zur Übung

Verwende den Datensatz oceanbuoys:

  • Imputiere Daten mit impute_lm() und füge year zum Modell hinzu.
  • Fasse die Imputationsmethoden zusammen, wobei ocean_imp_mean in mean, ocean_imp_lm_wind in lm_wind und ocean_imp_lm_wind_year in lm_wind_year überführt wird.
  • Betrachte die Werte von air_temp_c (auf der x-Achse) und humidity (auf der y-Achse), färbe nach vorhandenen Missings und facettiere nach Imputationsmodell.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Build a model adding year to the outcome
ocean_imp_lm_wind_year <- bind_shadow(___) %>%
  impute_lm(air_temp_c ~ wind_ew + wind_ns + ___) %>%
  impute_lm(humidity ~ wind_ew + wind_ns + ___) %>%
  add_label_shadow()

# Bind the mean, lm_wind, and lm_wind_year models together
bound_models <- bind_rows(mean = ocean_imp_mean,
                          lm_wind = ocean_imp_lm_wind,
                          lm_wind_year = ___,
                          .id = "imp_model")

# Explore air_temp and humidity, coloring by any missings, and faceting by imputation model
ggplot(___, aes(x = ___, y = ___, color = any_missing)) + 
  geom_point() + facet_wrap(~___)
Code bearbeiten und ausführen