Imputationen bewerten: Die Skalierung
Auch wenn die Mittelwert-Imputation im Boxplot gar nicht so schlecht aussieht, ist es wichtig, ein Gefühl für die Streuung in den Daten zu bekommen. Deshalb solltest du untersuchen, wie sich Skalierung und Verteilung der imputierten Werte im Vergleich zu den Originaldaten ändern.
Eine Möglichkeit, die Angemessenheit der Skalierung der Imputationen zu bewerten, ist ein Streudiagramm. So kannst du prüfen, ob die Werte plausibel sind oder nicht.
Diese Übung ist Teil des Kurses
Umgang mit fehlenden Daten in R
Anleitung zur Übung
Verwende die Daten mit bereits imputierten Werten, ocean_imp_mean:
- Untersuche die Imputationen in Lufttemperatur (auf der x-Achse) und Luftfeuchtigkeit (auf der y-Achse) mit einem Streudiagramm. Denk daran,
color = any_missingzu verwenden. - Baue auf dieser Visualisierung auf, indem du nach Jahr facettierst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Explore imputations in air temperature and humidity,
# coloring by the variable, any_missing
ggplot(___,
aes(x = ___, y = ___, color = ___)) +
geom_point()
# Explore imputations in air temperature and humidity,
# coloring by the variable, any_missing, and faceting by year
ggplot(___,
aes(x = ___, y = ___, color = ___)) +
___() +
facet_wrap(~___)