Missende cases en variabelen visualiseren
Om een duidelijk beeld te krijgen van de ontbrekende waarden over variabelen en cases, gebruik je gg_miss_var() en gg_miss_case(). Dit zijn de visuele tegenhangers van miss_var_summary() en miss_case_summary().
Je kunt deze opdelen in meerdere plots, één per categorie, door een variabele te kiezen om op te facetten.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in R
Oefeninstructies
Gebruik de riskfactors-gegevensset:
- Visualiseer het aantal missings in cases met
gg_miss_case(). - Onderzoek het aantal missings in cases met
gg_miss_case()en facet op de variabeleeducation. - Visualiseer het aantal missings in variabelen met
gg_miss_var(). - Onderzoek het aantal missings in variabelen met
gg_miss_var()en facet op de variabeleeducation.
Wat valt je op in de visualisaties van de volledige data vergeleken met die met facetten?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Visualize the number of missings in cases using `gg_miss_case()`
gg_miss_case(___)
# Explore the number of missings in cases using `gg_miss_case()`
# and facet by the variable `education`
gg_miss_case(___, facet = ___)
# Visualize the number of missings in variables using `gg_miss_var()`
gg_miss_var(___)
# Explore the number of missings in variables using `gg_miss_var()`
# and facet by the variable `education`
___(___, facet = ___)