Histogramm der imputierten Daten erstellen
Jetzt, wo wir die erste Visualisierung von geom_miss_point() nachbauen können, schauen wir uns an, wie wir das auf andere explorative Aufgaben anwenden können.
Eine sinnvolle Aufgabe ist es, die Anzahl der fehlenden Werte in einer bestimmten Variable mit einem Histogramm zu bewerten. Das können wir mit dem Datensatz ocean_imp_track tun, den wir in der letzten Übung erstellt haben und der in dieser Session geladen ist.
Diese Übung ist Teil des Kurses
Umgang mit fehlenden Daten in R
Anleitung zur Übung
Verwende die imputierten und verfolgten Daten ocean_imp_track:
- Untersuche die Werte von
air_temp_cund visualisiere die Anzahl der fehlenden Werte mitair_temp_c_NA. - Untersuche die fehlenden Werte in
humiditymithumidity_NA. - Untersuche die fehlenden Werte in
air_temp_cnach Jahr mitfacet_wrap(~year). - untersuche die fehlenden Werte in
humiditynach Jahr mitfacet_wrap(~year).
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Explore the values of air_temp_c, visualizing the amount of missings with `air_temp_c_NA`.
p <- ggplot(___, aes(x = ___, fill = ___)) + ___()
# Expore the missings in humidity using humidity_NA
p2 <- ggplot(___, aes(x = ___, fill = ___)) + ___()
# Explore the missings in air_temp_c according to year, using `facet_wrap(~year)`.
p + facet_wrap(~___)
# Explore the missings in humidity according to year, using `facet_wrap(~year)`.
p2 + facet_wrap(~___)