Imputationen bewerten: Über viele Variablen hinweg
Bisher haben wir uns angeschaut, wie einzelne Variablen oder Variablenpaare und deren imputierte Werte untersucht werden können. Manchmal möchtest du jedoch die Imputationen für viele Variablen betrachten. Dafür brauchst du etwas Data Munging und Umstrukturierung. In dieser Lektion lernst du, wie dieses Data Wrangling funktioniert – das kann in nabular-Daten etwas knifflig werden. Die Funktion shadow_long() bringt die Daten in die passende Form für solche Visualisierungen.
Diese Übung ist Teil des Kurses
Umgang mit fehlenden Daten in R
Anleitung zur Übung
- Verwende
shadow_long(), um die imputierten Datenocean_imp_meanzu sammeln, mit Fokus aufhumidityundair_temp_c. - Gib die Daten aus und inspiziere sie.
- Erkunde die Imputationen in einem Histogramm mit
geom_histogram(), platziere die Werte auf der x-Achse, fülle nach Missingness und facettiere nachvariable.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Gather the imputed data
ocean_imp_mean_gather <- shadow_long(___,
___,
___))
# Inspect the data
___
# Explore the imputations in a histogram
ggplot(ocean_imp_mean_gather,
aes(x = value, fill = value_NA)) +
geom_histogram() +
facet_wrap(~variable)