Fehlwerte tabellieren
Die Zusammenfassungen der Fehlwerte, die wir gerade berechnet haben, geben uns die Anzahl und den Prozentsatz fehlender Beobachtungen für die Fälle und Variablen.
Eine weitere Möglichkeit, Fehlwerte zusammenzufassen, ist, zu zählen, wie oft 0, 1, 2, 3 usw. Fehlwerte in einer Variable oder in einem Fall vorkommen.
In dieser Übung tabellieren wir die Anzahl der Fehlwerte in jedem Fall und in jeder Variable mit miss_var_table() und miss_case_table() und kombinieren diese Zusammenfassungen mit dem group_by-Operator aus dplyr, um die Zusammenfassungen über eine Gruppierungsvariable im Datensatz zu untersuchen.
Diese Übung ist Teil des Kurses
Umgang mit fehlenden Daten in R
Anleitung zur Übung
Für den Datensatz airquality:
- Tabelliere die Fehlwerte für jede Variable mit
miss_var_table(). - Tabelliere die Fehlwerte für jeden Fall mit
miss_case_table(). - Kombiniere die vorherigen Tabellierungen mit
group_by()ausdplyr, um für jede Variable und jeden Fall nachMonthzu tabellieren.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Tabulate missingness in each variable and case of the `airquality` dataset
___(airquality)
___(___)
# Tabulate the missingness in each variable, grouped by Month, in the `airquality` dataset
airquality %>% group_by(___) %>% miss_var_table()
# Tabulate of missingness in each case, grouped by Month, in the `airquality` dataset
airquality %>% ___ %>% miss_case_table()