LoslegenKostenlos loslegen

Weitere Zusammenfassungen von Missingness

Einige Zusammenfassungen von Missingness sind für unterschiedliche Datentypen besonders hilfreich, zum Beispiel miss_var_span() und miss_var_run().

  • miss_var_span() berechnet die Anzahl fehlender Werte in einer angegebenen Variable über wiederkehrende Spannen. Das ist besonders nützlich bei Zeitreihen, um etwa wöchentliche (7-Tage-)Muster fehlender Werte zu erkennen.

  • miss_var_run() berechnet die Anzahl der „Runs“ oder „Streaks“ von Missingness. Das hilft, ungewöhnliche Muster zu finden – du könntest zum Beispiel ein wiederkehrendes Muster von 5 vollständigen und 5 fehlenden beobachten.

Sowohl miss_var_span() als auch miss_var_run() funktionieren mit dem group_by-Operator aus dplyr.

Diese Übung ist Teil des Kurses

Umgang mit fehlenden Daten in R

Kurs anzeigen

Anleitung zur Übung

Verwende den Datensatz pedestrian aus naniar:

  • Berechne Zusammenfassungen der Missingness für die Variablen im Datensatz mit miss_var_span(), für eine Spanne von 4000.
  • Berechne Zusammenfassungen der Missingness für die Fälle im Datensatz mit miss_var_run().
  • Kombiniere das mit dem group_by-Operator von dplyr für month.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Calculate the summaries for each run of missingness for the variable, hourly_counts
miss_var_run(pedestrian, var = ___)

# Calculate the summaries for each span of missingness, 
# for a span of 4000, for the variable hourly_counts
miss_var_span(pedestrian, var = ___, span_every = ___)

# For each `month` variable, calculate the run of missingness for hourly_counts
pedestrian %>% group_by(month) %>% ___()

# For each `month` variable, calculate the span of missingness 
# of a span of 2000, for the variable hourly_counts
pedestrian %>% group_by(___) %>% ___(var = ___, span_every = ___)
Code bearbeiten und ausführen