LoslegenKostenlos starten

Gruppierte Zusammenfassungen der Fehlendheit erstellen

Jetzt, da du nabulare Daten erstellen kannst, nutzen wir sie zur Exploration. Wir berechnen Kennzahlen, basierend auf der Fehlendheit einer anderen Variable.

Dazu verwenden wir folgende Schritte:

  • Zuerst wandelt bind_shadow() die Daten in nabulare Daten um.

  • Als Nächstes erstellst du Zusammenfassungen mit group_by() und summarize(), um Mittelwert und Standardabweichung mit den Funktionen mean() und sd() zu berechnen.

Diese Übung ist Teil des Kurses

<Kurs>Umgang mit fehlenden Daten in R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Für den Datensatz oceanbuoys:

  • bind_shadow() ausführen, dann mit group_by() nach der Fehlendheit von humidity (humidity_NA) gruppieren und mit summarize() aus dplyr die Mittelwerte und Standardabweichungen für Wind Ost–West (wind_ew) berechnen.

  • Wiederhole dies, aber berechne die Zusammenfassungen für Wind Nord–Süd (wind_ns).

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# `bind_shadow()` and `group_by()` humidity missingness (`humidity_NA`)
oceanbuoys %>%
  ___() %>%
  group_by(___) %>% 
  summarize(wind_ew_mean = mean(___), # calculate mean of wind_ew
            wind_ew_sd = ___)) # calculate standard deviation of wind_ew
  
# Repeat this, but calculating summaries for wind north south (`wind_ns`).
___ %>%
  ___ %>%
  group_by(___) %>%
  summarize(___ = ___(___),
            ___ = ___(___))
Code bearbeiten und ausführen