Aan de slagBegin gratis

Slechte imputaties beoordelen

Om imputaties te kunnen beoordelen, helpt het om te weten hoe iets slechts eruitziet. Laten we hiervoor een typisch slechte imputatiemethode bekijken: imputeren met de gemiddelde waarde.

In deze oefening ga je onderzoeken hoe de mean-imputatiemethode werkt met een boxplot, met de oceanbuoys-gegevensset.

Deze oefening maakt deel uit van de cursus

Omgaan met ontbrekende gegevens in R

Bekijk cursus

Oefeninstructies

Voor de oceanbuoys-gegevensset:

  • Imputeer de gemiddelde waarde met impute_mean_all() en houd deze imputaties bij met add_label_shadow().
  • Onderzoek de geïmputeerde waarden in luchtvochtigheid (humidity) met een boxplot.
  • Onderzoek de geïmputeerde waarden in luchttemperatuur (air_temp_c) met een boxplot.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Impute the mean value and track the imputations 
ocean_imp_mean <- bind_shadow(___) %>% 
  ___() %>% 
  ___()

# Explore the mean values in humidity in the imputed dataset
ggplot(___, 
       aes(x = ___, y = ___)) + 
  geom_boxplot()

# Explore the values in air temperature in the imputed dataset
ggplot(___, 
       aes(x = ___, y = ___)) + 
  geom_boxplot()
Code bewerken en uitvoeren