LoslegenKostenlos loslegen

Fehlwerte tabellieren

Die Zusammenfassungen der Fehlwerte, die wir gerade berechnet haben, geben uns die Anzahl und den Prozentsatz fehlender Beobachtungen für die Fälle und Variablen.

Eine weitere Möglichkeit, Fehlwerte zusammenzufassen, ist, zu zählen, wie oft 0, 1, 2, 3 usw. Fehlwerte in einer Variable oder in einem Fall vorkommen.

In dieser Übung tabellieren wir die Anzahl der Fehlwerte in jedem Fall und in jeder Variable mit miss_var_table() und miss_case_table() und kombinieren diese Zusammenfassungen mit dem group_by-Operator aus dplyr, um die Zusammenfassungen über eine Gruppierungsvariable im Datensatz zu untersuchen.

Diese Übung ist Teil des Kurses

Umgang mit fehlenden Daten in R

Kurs anzeigen

Anleitung zur Übung

Für den Datensatz airquality:

  • Tabelliere die Fehlwerte für jede Variable mit miss_var_table().
  • Tabelliere die Fehlwerte für jeden Fall mit miss_case_table().
  • Kombiniere die vorherigen Tabellierungen mit group_by() aus dplyr, um für jede Variable und jeden Fall nach Month zu tabellieren.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Tabulate missingness in each variable and case of the `airquality` dataset
___(airquality)
___(___)

# Tabulate the missingness in each variable, grouped by Month, in the `airquality` dataset
airquality %>% group_by(___) %>% miss_var_table()

# Tabulate of missingness in each case, grouped by Month, in the `airquality` dataset
airquality %>% ___ %>% miss_case_table()
Code bearbeiten und ausführen