Imputierte Werte in einem Streudiagramm visualisieren
Lass uns nun eines der Diagramme aus Kapitel drei nachbauen, das geom_miss_point() verwendet hat.
Dafür müssen wir die Daten unterhalb des Wertebereichs imputieren. Das ist eine spezielle Art der Imputation, um die Daten zu erkunden. Diese Imputation zeigt, was wir üben müssen: wie man fehlende Werte nachverfolgt. Um die Daten unterhalb des Wertebereichs zu imputieren, verwenden wir die Funktion impute_below_all().
Diese Übung ist Teil des Kurses
Umgang mit fehlenden Daten in R
Anleitung zur Übung
Verwende die oceanbuoys-Daten:
- Imputiere und tracke die fehlenden Werte mit
bind_shadow(),impute_below_all()undadd_label_shadow(). - Visualisiere die Missingness von Wind und Lufttemperatur auf der x- bzw. y-Achse und färbe fehlende Lufttemperaturwerte mit
air_temp_c_NAein. - Visualisiere Luftfeuchtigkeit und Lufttemperatur auf der x- bzw. y-Achse und färbe alle fehlenden Fälle mit der Variable
any_missingein.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Impute and track the missing values
ocean_imp_track <- bind_shadow(___) %>%
impute_below_all() %>%
add_label_shadow()
# Visualize the missingness in wind and air temperature,
# coloring missing air temp values with air_temp_c_NA
ggplot(___,
aes(x = ___, y = ___, color = ___)) +
geom_point()
# Visualize humidity and air temp, coloring any missing cases using the variable any_missing
ggplot(___,
aes(x = ___, y = ___, color = ___)) +
geom_point()