LoslegenKostenlos loslegen

Schlechte Imputationen bewerten

Um Imputationen bewerten zu können, hilft es, zu wissen, wie etwas Schlechtes aussieht. Dazu schauen wir uns eine typischerweise schlechte Imputationsmethode an: das Ersetzen durch den Mittelwert.

In dieser Übung untersuchen wir mit einem Boxplot, wie die Mittelwert-Imputation funktioniert, und verwenden dafür den Datensatz oceanbuoys.

Diese Übung ist Teil des Kurses

Umgang mit fehlenden Daten in R

Kurs anzeigen

Anleitung zur Übung

Für den Datensatz oceanbuoys:

  • Imputiere den Mittelwert mit impute_mean_all() und zeichne diese Imputationen mit add_label_shadow() nach.
  • Untersuche die imputierten Werte der Luftfeuchtigkeit (humidity) mit einem Boxplot.
  • Untersuche die imputierten Werte der Lufttemperatur (air_temp_c) mit einem Boxplot.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Impute the mean value and track the imputations 
ocean_imp_mean <- bind_shadow(___) %>% 
  ___() %>% 
  ___()

# Explore the mean values in humidity in the imputed dataset
ggplot(___, 
       aes(x = ___, y = ___)) + 
  geom_boxplot()

# Explore the values in air temperature in the imputed dataset
ggplot(___, 
       aes(x = ___, y = ___)) + 
  geom_boxplot()
Code bearbeiten und ausführen