LoslegenKostenlos loslegen

Imputationen bewerten: Über viele Variablen hinweg

Bisher haben wir uns angeschaut, wie einzelne Variablen oder Variablenpaare und deren imputierte Werte untersucht werden können. Manchmal möchtest du jedoch die Imputationen für viele Variablen betrachten. Dafür brauchst du etwas Data Munging und Umstrukturierung. In dieser Lektion lernst du, wie dieses Data Wrangling funktioniert – das kann in nabular-Daten etwas knifflig werden. Die Funktion shadow_long() bringt die Daten in die passende Form für solche Visualisierungen.

Diese Übung ist Teil des Kurses

Umgang mit fehlenden Daten in R

Kurs anzeigen

Anleitung zur Übung

  • Verwende shadow_long(), um die imputierten Daten ocean_imp_mean zu sammeln, mit Fokus auf humidity und air_temp_c.
  • Gib die Daten aus und inspiziere sie.
  • Erkunde die Imputationen in einem Histogramm mit geom_histogram(), platziere die Werte auf der x-Achse, fülle nach Missingness und facettiere nach variable.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Gather the imputed data 
ocean_imp_mean_gather <- shadow_long(___,
                                     ___,
                                     ___))
# Inspect the data
___

# Explore the imputations in a histogram 
ggplot(ocean_imp_mean_gather, 
       aes(x = value, fill = value_NA)) + 
  geom_histogram() + 
  facet_wrap(~variable)
Code bearbeiten und ausführen