Aan de slagGa gratis aan de slag

Slechte imputaties beoordelen

Om imputaties te kunnen beoordelen, helpt het om te weten hoe iets slechts eruitziet. Laten we hiervoor een typisch slechte imputatiemethode bekijken: imputeren met de gemiddelde waarde.

In deze oefening ga je onderzoeken hoe de mean-imputatiemethode werkt met een boxplot, met de oceanbuoys-gegevensset.

Deze oefening maakt deel uit van de cursus

Omgaan met ontbrekende gegevens in R

Cursus bekijken

Oefeninstructies

Voor de oceanbuoys-gegevensset:

  • Imputeer de gemiddelde waarde met impute_mean_all() en houd deze imputaties bij met add_label_shadow().
  • Onderzoek de geïmputeerde waarden in luchtvochtigheid (humidity) met een boxplot.
  • Onderzoek de geïmputeerde waarden in luchttemperatuur (air_temp_c) met een boxplot.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Impute the mean value and track the imputations 
ocean_imp_mean <- bind_shadow(___) %>% 
  ___() %>% 
  ___()

# Explore the mean values in humidity in the imputed dataset
ggplot(___, 
       aes(x = ___, y = ___)) + 
  geom_boxplot()

# Explore the values in air temperature in the imputed dataset
ggplot(___, 
       aes(x = ___, y = ___)) + 
  geom_boxplot()
Code bewerken en uitvoeren