LoslegenKostenlos loslegen

Imputationen bewerten: Die Skalierung

Auch wenn die Mittelwert-Imputation im Boxplot gar nicht so schlecht aussieht, ist es wichtig, ein Gefühl für die Streuung in den Daten zu bekommen. Deshalb solltest du untersuchen, wie sich Skalierung und Verteilung der imputierten Werte im Vergleich zu den Originaldaten ändern.

Eine Möglichkeit, die Angemessenheit der Skalierung der Imputationen zu bewerten, ist ein Streudiagramm. So kannst du prüfen, ob die Werte plausibel sind oder nicht.

Diese Übung ist Teil des Kurses

Umgang mit fehlenden Daten in R

Kurs anzeigen

Anleitung zur Übung

Verwende die Daten mit bereits imputierten Werten, ocean_imp_mean:

  • Untersuche die Imputationen in Lufttemperatur (auf der x-Achse) und Luftfeuchtigkeit (auf der y-Achse) mit einem Streudiagramm. Denk daran, color = any_missing zu verwenden.
  • Baue auf dieser Visualisierung auf, indem du nach Jahr facettierst.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Explore imputations in air temperature and humidity,  
# coloring by the variable, any_missing
ggplot(___, 
       aes(x = ___, y = ___, color = ___)) + 
  geom_point()

# Explore imputations in air temperature and humidity,  
# coloring by the variable, any_missing, and faceting by year
ggplot(___, 
       aes(x = ___, y = ___, color = ___)) + 
  ___() +  
  facet_wrap(~___)
Code bearbeiten und ausführen