Aan de slagGa gratis aan de slag

Ontbreekpatronen visualiseren

Oefen met een paar manieren om patronen van ontbrekende waarden te visualiseren met:

  • gg_miss_upset() voor een overzicht van het algehele patroon van ontbrekende waarden.
  • gg_miss_fct() voor een gegevensset met een interessante factor: huwelijk.
  • en gg_miss_span() om ontbrekende waarden in een tijdreeksgegevensset te verkennen.

Wat valt je op aan de ontbrekende waarden en de facettering in de data?

Deze oefening maakt deel uit van de cursus

Omgaan met ontbrekende gegevens in R

Cursus bekijken

Oefeninstructies

  • Verken het patroon van ontbrekende waarden in de airquality-gegevensset met gg_miss_upset().
  • Onderzoek hoe de ontbrekende waarden veranderen in de riskfactors-gegevensset over de marital-variabele met gg_miss_fct()
  • Onderzoek hoe de ontbrekende waarden veranderen in de pedestrian-gegevensset over de hourly_counts-variabele met een span van 3000 (je kunt ook verschillende spans tussen 2000-5000 proberen).
  • Onderzoek het effect van month op hourly_counts door het op te nemen in het facet-argument, met een span van 1000.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Using the airquality dataset, explore the missingness pattern using gg_miss_upset()
gg_miss_upset(airquality)

# With the riskfactors dataset, explore how the missingness changes across the marital variable using gg_miss_fct()
gg_miss_fct(x = riskfactors, fct = marital)

# Using the pedestrian dataset, explore how the missingness of hourly_counts changes over a span of 3000 
gg_miss_span(pedestrian, var = ___, span_every = ___)

# Using the pedestrian dataset, explore the impact of month by faceting by month
# and explore how missingness changes for a span of 1000
____(___, var = ___ , span_every = ___, facet = ___)
Code bewerken en uitvoeren