LoslegenKostenlos starten

Fehlwerte tabellieren

Die Zusammenfassungen der Fehlwerte, die wir gerade berechnet haben, geben uns die Anzahl und den Prozentsatz fehlender Beobachtungen für die Fälle und Variablen.

Eine weitere Möglichkeit, Fehlwerte zusammenzufassen, ist, zu zählen, wie oft 0, 1, 2, 3 usw. Fehlwerte in einer Variable oder in einem Fall vorkommen.

In dieser Übung tabellieren wir die Anzahl der Fehlwerte in jedem Fall und in jeder Variable mit miss_var_table() und miss_case_table() und kombinieren diese Zusammenfassungen mit dem group_by-Operator aus dplyr, um die Zusammenfassungen über eine Gruppierungsvariable im Datensatz zu untersuchen.

Diese Übung ist Teil des Kurses

<Kurs>Umgang mit fehlenden Daten in R</Kurs>
Kurs ansehen

Übungsanweisungen

Für den Datensatz airquality:

  • Tabelliere die Fehlwerte für jede Variable mit miss_var_table().
  • Tabelliere die Fehlwerte für jeden Fall mit miss_case_table().
  • Kombiniere die vorherigen Tabellierungen mit group_by() aus dplyr, um für jede Variable und jeden Fall nach Month zu tabellieren.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Tabulate missingness in each variable and case of the `airquality` dataset
___(airquality)
___(___)

# Tabulate the missingness in each variable, grouped by Month, in the `airquality` dataset
airquality %>% group_by(___) %>% miss_var_table()

# Tabulate of missingness in each case, grouped by Month, in the `airquality` dataset
airquality %>% ___ %>% miss_case_table()
Code bearbeiten und ausführen