Nabular-Daten und Füllen nach Fehlwerten
Kennzahlen sind hilfreich zu berechnen, aber wie man so sagt: Ein Bild sagt mehr als tausend Worte.
In dieser Übung schauen wir uns an, wie du nabular-Daten nutzen kannst, um die Variation in einer Variable in Abhängigkeit von den Fehlwerten einer anderen zu untersuchen.
Wir verwenden dafür den Datensatz oceanbuoys aus naniar.
Diese Übung ist Teil des Kurses
Umgang mit fehlenden Daten in R
Anleitung zur Übung
- Untersuche zunächst die Struktur der Fehlwerte in
oceanbuoysmitvis_miss(). - Untersuche die Verteilung von Wind Ost–West (
wind_ew) in Abhängigkeit von den Fehlwerten der Lufttemperatur mitgeom_density(). - Untersuche die Verteilung der Meerestemperatur in Abhängigkeit von den Fehlwerten der Luftfeuchtigkeit mit
geom_density().
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# First explore the missingness structure of `oceanbuoys` using `vis_miss()`
vis_miss(___)
# Explore the distribution of `wind_ew` for the missingness
# of `air_temp_c_NA` using `geom_density()`
bind_shadow(oceanbuoys) %>%
ggplot(aes(x = ___,
color = air_temp_c_NA)) +
geom_density()
# Explore the distribution of sea temperature for the
# missingness of humidity (humidity_NA) using `geom_density()`
___(___) %>%
ggplot(aes(x = ___,
color = ___)) +
geom_density()