LoslegenKostenlos starten

Imputationen bewerten: Über viele Variablen hinweg

Bisher haben wir uns angeschaut, wie einzelne Variablen oder Variablenpaare und deren imputierte Werte untersucht werden können. Manchmal möchtest du jedoch die Imputationen für viele Variablen betrachten. Dafür brauchst du etwas Data Munging und Umstrukturierung. In dieser Lektion lernst du, wie dieses Data Wrangling funktioniert – das kann in nabular-Daten etwas knifflig werden. Die Funktion shadow_long() bringt die Daten in die passende Form für solche Visualisierungen.

Diese Übung ist Teil des Kurses

<Kurs>Umgang mit fehlenden Daten in R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Verwende shadow_long(), um die imputierten Daten ocean_imp_mean zu sammeln, mit Fokus auf humidity und air_temp_c.
  • Gib die Daten aus und inspiziere sie.
  • Erkunde die Imputationen in einem Histogramm mit geom_histogram(), platziere die Werte auf der x-Achse, fülle nach Missingness und facettiere nach variable.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Gather the imputed data 
ocean_imp_mean_gather <- shadow_long(___,
                                     ___,
                                     ___))
# Inspect the data
___

# Explore the imputations in a histogram 
ggplot(ocean_imp_mean_gather, 
       aes(x = value, fill = value_NA)) + 
  geom_histogram() + 
  facet_wrap(~variable)
Code bearbeiten und ausführen