LoslegenKostenlos loslegen

Imputierte Werte in einem Streudiagramm visualisieren

Lass uns nun eines der Diagramme aus Kapitel drei nachbauen, das geom_miss_point() verwendet hat.

Dafür müssen wir die Daten unterhalb des Wertebereichs imputieren. Das ist eine spezielle Art der Imputation, um die Daten zu erkunden. Diese Imputation zeigt, was wir üben müssen: wie man fehlende Werte nachverfolgt. Um die Daten unterhalb des Wertebereichs zu imputieren, verwenden wir die Funktion impute_below_all().

Diese Übung ist Teil des Kurses

Umgang mit fehlenden Daten in R

Kurs anzeigen

Anleitung zur Übung

Verwende die oceanbuoys-Daten:

  • Imputiere und tracke die fehlenden Werte mit bind_shadow(), impute_below_all() und add_label_shadow().
  • Visualisiere die Missingness von Wind und Lufttemperatur auf der x- bzw. y-Achse und färbe fehlende Lufttemperaturwerte mit air_temp_c_NA ein.
  • Visualisiere Luftfeuchtigkeit und Lufttemperatur auf der x- bzw. y-Achse und färbe alle fehlenden Fälle mit der Variable any_missing ein.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Impute and track the missing values
ocean_imp_track <- bind_shadow(___) %>% 
  impute_below_all() %>% 
  add_label_shadow()

# Visualize the missingness in wind and air temperature,  
# coloring missing air temp values with air_temp_c_NA
ggplot(___, 
       aes(x = ___, y = ___, color = ___)) + 
  geom_point()

# Visualize humidity and air temp, coloring any missing cases using the variable any_missing
ggplot(___, 
       aes(x = ___, y = ___, color = ___)) +  
  geom_point()
Code bearbeiten und ausführen