Fehlermuster visualisieren
Lass uns ein paar verschiedene Wege üben, Muster von Missingness zu visualisieren, und zwar mit:
gg_miss_upset()für einen Gesamtüberblick über die Missingness.gg_miss_fct()für einen Datensatz mit einem interessierenden Faktor: marriage.- und
gg_miss_span()zur Untersuchung der Missingness in einem Zeitreihendatensatz.
Was fällt dir bei der Missingness und der Facettierung in den Daten auf?
Diese Übung ist Teil des Kurses
<Kurs>Umgang mit fehlenden Daten in R</Kurs>Übungsanweisungen
- Untersuche das Missingness-Muster des
airquality-Datensatzes mitgg_miss_upset(). - Untersuche mit
gg_miss_fct(), wie sich die Missingness imriskfactors-Datensatz über die Variablemaritalverändert. - Untersuche, wie sich die Missingness im
pedestrian-Datensatz über die Variablehourly_countsüber eine Spannweite von 3000 verändert (du kannst auch andere Spannweiten zwischen 2000 und 5000 ausprobieren). - Untersuche den Einfluss von
monthaufhourly_counts, indem du es imfacet-Argument berücksichtigst, mit einer Spannweite von 1000.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Using the airquality dataset, explore the missingness pattern using gg_miss_upset()
gg_miss_upset(airquality)
# With the riskfactors dataset, explore how the missingness changes across the marital variable using gg_miss_fct()
gg_miss_fct(x = riskfactors, fct = marital)
# Using the pedestrian dataset, explore how the missingness of hourly_counts changes over a span of 3000
gg_miss_span(pedestrian, var = ___, span_every = ___)
# Using the pedestrian dataset, explore the impact of month by faceting by month
# and explore how missingness changes for a span of 1000
____(___, var = ___ , span_every = ___, facet = ___)