Gruppierte Zusammenfassungen der Fehlendheit erstellen
Jetzt, da du nabulare Daten erstellen kannst, nutzen wir sie zur Exploration. Wir berechnen Kennzahlen, basierend auf der Fehlendheit einer anderen Variable.
Dazu verwenden wir folgende Schritte:
Zuerst wandelt
bind_shadow()die Daten in nabulare Daten um.Als Nächstes erstellst du Zusammenfassungen mit
group_by()undsummarize(), um Mittelwert und Standardabweichung mit den Funktionenmean()undsd()zu berechnen.
Diese Übung ist Teil des Kurses
Umgang mit fehlenden Daten in R
Anleitung zur Übung
Für den Datensatz
oceanbuoys:bind_shadow()ausführen, dann mitgroup_by()nach der Fehlendheit von humidity (humidity_NA) gruppieren und mitsummarize()aus dplyr die Mittelwerte und Standardabweichungen für Wind Ost–West (wind_ew) berechnen.Wiederhole dies, aber berechne die Zusammenfassungen für Wind Nord–Süd (
wind_ns).
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# `bind_shadow()` and `group_by()` humidity missingness (`humidity_NA`)
oceanbuoys %>%
___() %>%
group_by(___) %>%
summarize(wind_ew_mean = mean(___), # calculate mean of wind_ew
wind_ew_sd = ___)) # calculate standard deviation of wind_ew
# Repeat this, but calculating summaries for wind north south (`wind_ns`).
___ %>%
___ %>%
group_by(___) %>%
summarize(___ = ___(___),
___ = ___(___))