Ontbreekpatronen visualiseren
Oefen met een paar manieren om patronen van ontbrekende waarden te visualiseren met:
gg_miss_upset()voor een overzicht van het algehele patroon van ontbrekende waarden.gg_miss_fct()voor een gegevensset met een interessante factor: huwelijk.- en
gg_miss_span()om ontbrekende waarden in een tijdreeksgegevensset te verkennen.
Wat valt je op aan de ontbrekende waarden en de facettering in de data?
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in R
Oefeninstructies
- Verken het patroon van ontbrekende waarden in de
airquality-gegevensset metgg_miss_upset(). - Onderzoek hoe de ontbrekende waarden veranderen in de
riskfactors-gegevensset over demarital-variabele metgg_miss_fct() - Onderzoek hoe de ontbrekende waarden veranderen in de
pedestrian-gegevensset over dehourly_counts-variabele met een span van 3000 (je kunt ook verschillende spans tussen 2000-5000 proberen). - Onderzoek het effect van
monthophourly_countsdoor het op te nemen in hetfacet-argument, met een span van 1000.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Using the airquality dataset, explore the missingness pattern using gg_miss_upset()
gg_miss_upset(airquality)
# With the riskfactors dataset, explore how the missingness changes across the marital variable using gg_miss_fct()
gg_miss_fct(x = riskfactors, fct = marital)
# Using the pedestrian dataset, explore how the missingness of hourly_counts changes over a span of 3000
gg_miss_span(pedestrian, var = ___, span_every = ___)
# Using the pedestrian dataset, explore the impact of month by faceting by month
# and explore how missingness changes for a span of 1000
____(___, var = ___ , span_every = ___, facet = ___)