LoslegenKostenlos loslegen

Fehlermuster visualisieren

Lass uns ein paar verschiedene Wege üben, Muster von Missingness zu visualisieren, und zwar mit:

  • gg_miss_upset() für einen Gesamtüberblick über die Missingness.
  • gg_miss_fct() für einen Datensatz mit einem interessierenden Faktor: marriage.
  • und gg_miss_span() zur Untersuchung der Missingness in einem Zeitreihendatensatz.

Was fällt dir bei der Missingness und der Facettierung in den Daten auf?

Diese Übung ist Teil des Kurses

Umgang mit fehlenden Daten in R

Kurs anzeigen

Anleitung zur Übung

  • Untersuche das Missingness-Muster des airquality-Datensatzes mit gg_miss_upset().
  • Untersuche mit gg_miss_fct(), wie sich die Missingness im riskfactors-Datensatz über die Variable marital verändert.
  • Untersuche, wie sich die Missingness im pedestrian-Datensatz über die Variable hourly_counts über eine Spannweite von 3000 verändert (du kannst auch andere Spannweiten zwischen 2000 und 5000 ausprobieren).
  • Untersuche den Einfluss von month auf hourly_counts, indem du es im facet-Argument berücksichtigst, mit einer Spannweite von 1000.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Using the airquality dataset, explore the missingness pattern using gg_miss_upset()
gg_miss_upset(airquality)

# With the riskfactors dataset, explore how the missingness changes across the marital variable using gg_miss_fct()
gg_miss_fct(x = riskfactors, fct = marital)

# Using the pedestrian dataset, explore how the missingness of hourly_counts changes over a span of 3000 
gg_miss_span(pedestrian, var = ___, span_every = ___)

# Using the pedestrian dataset, explore the impact of month by faceting by month
# and explore how missingness changes for a span of 1000
____(___, var = ___ , span_every = ___, facet = ___)
Code bearbeiten und ausführen