Slechte imputaties beoordelen
Om imputaties te kunnen beoordelen, helpt het om te weten hoe iets slechts eruitziet. Laten we hiervoor een typisch slechte imputatiemethode bekijken: imputeren met de gemiddelde waarde.
In deze oefening ga je onderzoeken hoe de mean-imputatiemethode werkt met een boxplot, met de oceanbuoys-gegevensset.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in R
Oefeninstructies
Voor de oceanbuoys-gegevensset:
- Imputeer de gemiddelde waarde met
impute_mean_all()en houd deze imputaties bij metadd_label_shadow(). - Onderzoek de geïmputeerde waarden in luchtvochtigheid (
humidity) met een boxplot. - Onderzoek de geïmputeerde waarden in luchttemperatuur (
air_temp_c) met een boxplot.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Impute the mean value and track the imputations
ocean_imp_mean <- bind_shadow(___) %>%
___() %>%
___()
# Explore the mean values in humidity in the imputed dataset
ggplot(___,
aes(x = ___, y = ___)) +
geom_boxplot()
# Explore the values in air temperature in the imputed dataset
ggplot(___,
aes(x = ___, y = ___)) +
geom_boxplot()