Schlechte Imputationen bewerten
Um Imputationen bewerten zu können, hilft es, zu wissen, wie etwas Schlechtes aussieht. Dazu schauen wir uns eine typischerweise schlechte Imputationsmethode an: das Ersetzen durch den Mittelwert.
In dieser Übung untersuchen wir mit einem Boxplot, wie die Mittelwert-Imputation funktioniert, und verwenden dafür den Datensatz oceanbuoys.
Diese Übung ist Teil des Kurses
Umgang mit fehlenden Daten in R
Anleitung zur Übung
Für den Datensatz oceanbuoys:
- Imputiere den Mittelwert mit
impute_mean_all()und zeichne diese Imputationen mitadd_label_shadow()nach. - Untersuche die imputierten Werte der Luftfeuchtigkeit (
humidity) mit einem Boxplot. - Untersuche die imputierten Werte der Lufttemperatur (
air_temp_c) mit einem Boxplot.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Impute the mean value and track the imputations
ocean_imp_mean <- bind_shadow(___) %>%
___() %>%
___()
# Explore the mean values in humidity in the imputed dataset
ggplot(___,
aes(x = ___, y = ___)) +
geom_boxplot()
# Explore the values in air temperature in the imputed dataset
ggplot(___,
aes(x = ___, y = ___)) +
geom_boxplot()