Missings in een tabel samenvatten
De samenvattingen van ontbrekende waarden die we zojuist hebben berekend, geven het aantal en het percentage ontbrekende observaties voor de gevallen en variabelen.
Een andere manier om ontbrekende waarden samen te vatten, is door te turven hoe vaak er 0, 1, 2, 3 missings zijn in een variabele of in een geval.
In deze oefening gaan we het aantal missings per geval en per variabele in een tabel zetten met miss_var_table() en miss_case_table(). We combineren deze overzichten ook met de group_by-operator uit dplyr om de samenvattingen per groep in de gegevensset te verkennen.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in R
Oefeninstructies
Voor de gegevensset airquality:
- Zet het aantal missings per variabele in een tabel met
miss_var_table(). - Zet het aantal missings per geval in een tabel met
miss_case_table(). - Combineer de vorige tabellen met de functie
group_by()uitdplyrom tabellen per variabele en per geval te maken, uitgesplitst naar elkeMonth.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Tabulate missingness in each variable and case of the `airquality` dataset
___(airquality)
___(___)
# Tabulate the missingness in each variable, grouped by Month, in the `airquality` dataset
airquality %>% group_by(___) %>% miss_var_table()
# Tabulate of missingness in each case, grouped by Month, in the `airquality` dataset
airquality %>% ___ %>% miss_case_table()