LoslegenKostenlos loslegen

Gruppierte Zusammenfassungen der Fehlendheit erstellen

Jetzt, da du nabulare Daten erstellen kannst, nutzen wir sie zur Exploration. Wir berechnen Kennzahlen, basierend auf der Fehlendheit einer anderen Variable.

Dazu verwenden wir folgende Schritte:

  • Zuerst wandelt bind_shadow() die Daten in nabulare Daten um.

  • Als Nächstes erstellst du Zusammenfassungen mit group_by() und summarize(), um Mittelwert und Standardabweichung mit den Funktionen mean() und sd() zu berechnen.

Diese Übung ist Teil des Kurses

Umgang mit fehlenden Daten in R

Kurs anzeigen

Anleitung zur Übung

  • Für den Datensatz oceanbuoys:

  • bind_shadow() ausführen, dann mit group_by() nach der Fehlendheit von humidity (humidity_NA) gruppieren und mit summarize() aus dplyr die Mittelwerte und Standardabweichungen für Wind Ost–West (wind_ew) berechnen.

  • Wiederhole dies, aber berechne die Zusammenfassungen für Wind Nord–Süd (wind_ns).

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# `bind_shadow()` and `group_by()` humidity missingness (`humidity_NA`)
oceanbuoys %>%
  ___() %>%
  group_by(___) %>% 
  summarize(wind_ew_mean = mean(___), # calculate mean of wind_ew
            wind_ew_sd = ___)) # calculate standard deviation of wind_ew
  
# Repeat this, but calculating summaries for wind north south (`wind_ns`).
___ %>%
  ___ %>%
  group_by(___) %>%
  summarize(___ = ___(___),
            ___ = ___(___))
Code bearbeiten und ausführen