Je eerste visualisaties van ontbrekende data
Het kan lastig zijn om te zien waar de ontbrekende waarden in je data zitten, en visualisatie kan je hier echt bij helpen.
De functie vis_miss() maakt een overzichtsvisualisatie van de ontbrekendheid in de data. Je kunt ook de rijen clusteren op basis van ontbrekendheid met cluster = TRUE, en de kolommen sorteren van meest naar minst ontbrekend met sort_miss = TRUE.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in R
Oefeninstructies
Gebruik de riskfactors-gegevensset uit naniar:
- Gebruik
vis_miss()om de ontbrekendheid in de data te visualiseren. - Gebruik
vis_miss()metcluster = TRUEom clusters van ontbrekendheid te verkennen. - Gebruik
vis_miss()en sorteer de ontbrekende waarden metsort_missom de kolommen op ontbrekendheid te rangschikken.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Visualize all of the missingness in the `riskfactors` dataset
vis_miss(___)
# Visualize and cluster all of the missingness in the `riskfactors` dataset
vis_miss(___, ___ = TRUE)
# visualize and sort the columns by missingness in the `riskfactors` dataset
vis_miss(___, ___ = TRUE)