Aan de slagGa gratis aan de slag

Imputaties evalueren en vergelijken

Als je een imputatiemodel opstelt, is het een goed idee dit te vergelijken met een andere methode. In deze les vergelijken we de eerder geïmputeerde gegevensset die is gemaakt met impute_lm() met de gemiddelde-imputatiegegevensset. Beide gegevenssets zijn in deze oefening opgenomen als respectievelijk ocean_imp_lm_wind en ocean_imp_mean.

Deze oefening maakt deel uit van de cursus

Omgaan met ontbrekende gegevens in R

Cursus bekijken

Oefeninstructies

  • Voeg de modellen samen met bind_rows(), plaats het model ocean_imp_mean onder mean en ocean_imp_lm_wind onder lm_wind.
  • Bekijk de waarden van air_temp en humidity in een spreidingsdiagram, zet air_temp_c op de x-as, humidity op de y-as, kleur op eventuele missings, en facet op het gebruikte imputatiemodel (imp_model).

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Bind the models together 
bound_models <- bind_rows(mean = ___,
                          lm_wind = ___,
                          .id = "imp_model")

# Inspect the values of air_temp and humidity as a scatter plot
ggplot(___, 
       aes(x = ___, 
           y = ___, 
           color = any_missing)) +
  geom_point() + 
  facet_wrap(~___)
Code bewerken en uitvoeren