Gruppierte Zusammenfassungen der Fehlendheit erstellen
Jetzt, da du nabulare Daten erstellen kannst, nutzen wir sie zur Exploration. Wir berechnen Kennzahlen, basierend auf der Fehlendheit einer anderen Variable.
Dazu verwenden wir folgende Schritte:
Zuerst wandelt
bind_shadow()die Daten in nabulare Daten um.Als Nächstes erstellst du Zusammenfassungen mit
group_by()undsummarize(), um Mittelwert und Standardabweichung mit den Funktionenmean()undsd()zu berechnen.
Diese Übung ist Teil des Kurses
<Kurs>Umgang mit fehlenden Daten in R</Kurs>Übungsanweisungen
Für den Datensatz
oceanbuoys:bind_shadow()ausführen, dann mitgroup_by()nach der Fehlendheit von humidity (humidity_NA) gruppieren und mitsummarize()aus dplyr die Mittelwerte und Standardabweichungen für Wind Ost–West (wind_ew) berechnen.Wiederhole dies, aber berechne die Zusammenfassungen für Wind Nord–Süd (
wind_ns).
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# `bind_shadow()` and `group_by()` humidity missingness (`humidity_NA`)
oceanbuoys %>%
___() %>%
group_by(___) %>%
summarize(wind_ew_mean = mean(___), # calculate mean of wind_ew
wind_ew_sd = ___)) # calculate standard deviation of wind_ew
# Repeat this, but calculating summaries for wind north south (`wind_ns`).
___ %>%
___ %>%
group_by(___) %>%
summarize(___ = ___(___),
___ = ___(___))