LoslegenKostenlos starten

Fehlermuster visualisieren

Lass uns ein paar verschiedene Wege üben, Muster von Missingness zu visualisieren, und zwar mit:

  • gg_miss_upset() für einen Gesamtüberblick über die Missingness.
  • gg_miss_fct() für einen Datensatz mit einem interessierenden Faktor: marriage.
  • und gg_miss_span() zur Untersuchung der Missingness in einem Zeitreihendatensatz.

Was fällt dir bei der Missingness und der Facettierung in den Daten auf?

Diese Übung ist Teil des Kurses

<Kurs>Umgang mit fehlenden Daten in R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Untersuche das Missingness-Muster des airquality-Datensatzes mit gg_miss_upset().
  • Untersuche mit gg_miss_fct(), wie sich die Missingness im riskfactors-Datensatz über die Variable marital verändert.
  • Untersuche, wie sich die Missingness im pedestrian-Datensatz über die Variable hourly_counts über eine Spannweite von 3000 verändert (du kannst auch andere Spannweiten zwischen 2000 und 5000 ausprobieren).
  • Untersuche den Einfluss von month auf hourly_counts, indem du es im facet-Argument berücksichtigst, mit einer Spannweite von 1000.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Using the airquality dataset, explore the missingness pattern using gg_miss_upset()
gg_miss_upset(airquality)

# With the riskfactors dataset, explore how the missingness changes across the marital variable using gg_miss_fct()
gg_miss_fct(x = riskfactors, fct = marital)

# Using the pedestrian dataset, explore how the missingness of hourly_counts changes over a span of 3000 
gg_miss_span(pedestrian, var = ___, span_every = ___)

# Using the pedestrian dataset, explore the impact of month by faceting by month
# and explore how missingness changes for a span of 1000
____(___, var = ___ , span_every = ___, facet = ___)
Code bearbeiten und ausführen