Weitere Zusammenfassungen von Missingness
Einige Zusammenfassungen von Missingness sind für unterschiedliche Datentypen besonders hilfreich, zum Beispiel miss_var_span() und miss_var_run().
miss_var_span()berechnet die Anzahl fehlender Werte in einer angegebenen Variable über wiederkehrende Spannen. Das ist besonders nützlich bei Zeitreihen, um etwa wöchentliche (7-Tage-)Muster fehlender Werte zu erkennen.miss_var_run()berechnet die Anzahl der „Runs“ oder „Streaks“ von Missingness. Das hilft, ungewöhnliche Muster zu finden – du könntest zum Beispiel ein wiederkehrendes Muster von 5 vollständigen und 5 fehlenden beobachten.
Sowohl miss_var_span() als auch miss_var_run() funktionieren mit dem group_by-Operator aus dplyr.
Diese Übung ist Teil des Kurses
Umgang mit fehlenden Daten in R
Anleitung zur Übung
Verwende den Datensatz pedestrian aus naniar:
- Berechne Zusammenfassungen der Missingness für die Variablen im Datensatz mit
miss_var_span(), für eine Spanne von 4000. - Berechne Zusammenfassungen der Missingness für die Fälle im Datensatz mit
miss_var_run(). - Kombiniere das mit dem
group_by-Operator von dplyr fürmonth.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Calculate the summaries for each run of missingness for the variable, hourly_counts
miss_var_run(pedestrian, var = ___)
# Calculate the summaries for each span of missingness,
# for a span of 4000, for the variable hourly_counts
miss_var_span(pedestrian, var = ___, span_every = ___)
# For each `month` variable, calculate the run of missingness for hourly_counts
pedestrian %>% group_by(month) %>% ___()
# For each `month` variable, calculate the span of missingness
# of a span of 2000, for the variable hourly_counts
pedestrian %>% group_by(___) %>% ___(var = ___, span_every = ___)