Aan de slagGa gratis aan de slag

Imputaties beoordelen (meerdere modellen & variabelen)

Als je een imputatiemodel opbouwt, is het een goed idee om het te vergelijken met een andere methode.

In deze les ga je een laatste imputatiemodel toevoegen dat een extra, nuttig stuk informatie bevat dat helpt om een deel van de variatie in de data te verklaren. Daarna ga je de waarden vergelijken, net zoals je in de vorige les hebt gedaan.

Deze oefening maakt deel uit van de cursus

Omgaan met ontbrekende gegevens in R

Cursus bekijken

Oefeninstructies

Gebruik de oceanbuoys-gegevensset:

  • Imputeer data met impute_lm(), en voeg year toe aan het model.
  • Bind de imputatiemethoden samen, waarbij je ocean_imp_mean in mean plaatst, ocean_imp_lm_wind in lm_wind, en ocean_imp_lm_wind_year in lm_wind_year.
  • Bekijk de waarden van air_temp_c (op de x-as) en humidity (op de y-as), kleur op aanwezigheid van missings, en facet op imputatiemodel.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Build a model adding year to the outcome
ocean_imp_lm_wind_year <- bind_shadow(___) %>%
  impute_lm(air_temp_c ~ wind_ew + wind_ns + ___) %>%
  impute_lm(humidity ~ wind_ew + wind_ns + ___) %>%
  add_label_shadow()

# Bind the mean, lm_wind, and lm_wind_year models together
bound_models <- bind_rows(mean = ocean_imp_mean,
                          lm_wind = ocean_imp_lm_wind,
                          lm_wind_year = ___,
                          .id = "imp_model")

# Explore air_temp and humidity, coloring by any missings, and faceting by imputation model
ggplot(___, aes(x = ___, y = ___, color = any_missing)) + 
  geom_point() + facet_wrap(~___)
Code bewerken en uitvoeren