Daten unterhalb des Wertebereichs mit Nabular-Daten imputieren
Wir wollen die von uns imputierten Werte nachverfolgen. Wenn wir das nicht tun, ist es sehr schwierig zu beurteilen, wie gut die Imputationen sind.
Wir üben jetzt das Imputieren und rekonstruieren die Visualisierungen aus den vorherigen Aufgaben, indem wir Werte unterhalb des Bereichs der Daten imputieren.
Das ist eine sehr hilfreiche Methode, um fehlende Werte weiter zu erkunden, und liefert außerdem den Rahmen für die Imputation fehlender Werte.
Zuerst imputieren wir die Daten unterhalb des Bereichs mit impute_below_all(), und visualisieren die Daten anschließend. Wir stellen fest, dass wir in diesem Fall zwar sehen können, wo die fehlenden Werte liegen, wir sie aber irgendwie markieren müssen. Das Programmiermuster zum Verfolgen fehlender Daten hilft uns dabei.
Diese Übung ist Teil des Kurses
Umgang mit fehlenden Daten in R
Anleitung zur Übung
Mit den oceanbuoys-Daten:
- Imputiere unterhalb des Bereichs mit
impute_below_all(). - Visualisiere die neuen fehlenden Werte mit
wind_ewauf der x-Achse undair_temp_cauf der y-Achse. - Imputiere und verfolge Daten mit
bind_shadow(),impute_below_all()undadd_label_shadow(). - Zeige den Plot und inspiziere die imputierten Werte.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Impute the oceanbuoys data below the range using `impute_below`.
ocean_imp <- impute_below_all(___)
# Visualize the new missing values
ggplot(___,
aes(x = ___, y = ___)) +
geom_point()
# Impute and track data with `bind_shadow`, `impute_below_all`, and `add_label_shadow`
ocean_imp_track <- bind_shadow(___) %>%
___() %>%
___()
# Look at the imputed values
___