LoslegenKostenlos loslegen

Daten unterhalb des Wertebereichs mit Nabular-Daten imputieren

Wir wollen die von uns imputierten Werte nachverfolgen. Wenn wir das nicht tun, ist es sehr schwierig zu beurteilen, wie gut die Imputationen sind.

Wir üben jetzt das Imputieren und rekonstruieren die Visualisierungen aus den vorherigen Aufgaben, indem wir Werte unterhalb des Bereichs der Daten imputieren.

Das ist eine sehr hilfreiche Methode, um fehlende Werte weiter zu erkunden, und liefert außerdem den Rahmen für die Imputation fehlender Werte.

Zuerst imputieren wir die Daten unterhalb des Bereichs mit impute_below_all(), und visualisieren die Daten anschließend. Wir stellen fest, dass wir in diesem Fall zwar sehen können, wo die fehlenden Werte liegen, wir sie aber irgendwie markieren müssen. Das Programmiermuster zum Verfolgen fehlender Daten hilft uns dabei.

Diese Übung ist Teil des Kurses

Umgang mit fehlenden Daten in R

Kurs anzeigen

Anleitung zur Übung

Mit den oceanbuoys-Daten:

  • Imputiere unterhalb des Bereichs mit impute_below_all().
  • Visualisiere die neuen fehlenden Werte mit wind_ew auf der x-Achse und air_temp_c auf der y-Achse.
  • Imputiere und verfolge Daten mit bind_shadow(), impute_below_all() und add_label_shadow().
  • Zeige den Plot und inspiziere die imputierten Werte.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Impute the oceanbuoys data below the range using `impute_below`.
ocean_imp <- impute_below_all(___)

# Visualize the new missing values
ggplot(___, 
       aes(x = ___, y = ___)) +  
  geom_point()

# Impute and track data with `bind_shadow`, `impute_below_all`, and `add_label_shadow`
ocean_imp_track <- bind_shadow(___) %>% 
  ___() %>% 
  ___()

# Look at the imputed values
___
Code bearbeiten und ausführen