Fehlermuster visualisieren
Lass uns ein paar verschiedene Wege üben, Muster von Missingness zu visualisieren, und zwar mit:
gg_miss_upset()für einen Gesamtüberblick über die Missingness.gg_miss_fct()für einen Datensatz mit einem interessierenden Faktor: marriage.- und
gg_miss_span()zur Untersuchung der Missingness in einem Zeitreihendatensatz.
Was fällt dir bei der Missingness und der Facettierung in den Daten auf?
Diese Übung ist Teil des Kurses
Umgang mit fehlenden Daten in R
Anleitung zur Übung
- Untersuche das Missingness-Muster des
airquality-Datensatzes mitgg_miss_upset(). - Untersuche mit
gg_miss_fct(), wie sich die Missingness imriskfactors-Datensatz über die Variablemaritalverändert. - Untersuche, wie sich die Missingness im
pedestrian-Datensatz über die Variablehourly_countsüber eine Spannweite von 3000 verändert (du kannst auch andere Spannweiten zwischen 2000 und 5000 ausprobieren). - Untersuche den Einfluss von
monthaufhourly_counts, indem du es imfacet-Argument berücksichtigst, mit einer Spannweite von 1000.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Using the airquality dataset, explore the missingness pattern using gg_miss_upset()
gg_miss_upset(airquality)
# With the riskfactors dataset, explore how the missingness changes across the marital variable using gg_miss_fct()
gg_miss_fct(x = riskfactors, fct = marital)
# Using the pedestrian dataset, explore how the missingness of hourly_counts changes over a span of 3000
gg_miss_span(pedestrian, var = ___, span_every = ___)
# Using the pedestrian dataset, explore the impact of month by faceting by month
# and explore how missingness changes for a span of 1000
____(___, var = ___ , span_every = ___, facet = ___)