Aan de slagGa gratis aan de slag

Je eerste visualisaties van ontbrekende data

Het kan lastig zijn om te zien waar de ontbrekende waarden in je data zitten, en visualisatie kan je hier echt bij helpen.

De functie vis_miss() maakt een overzichtsvisualisatie van de ontbrekendheid in de data. Je kunt ook de rijen clusteren op basis van ontbrekendheid met cluster = TRUE, en de kolommen sorteren van meest naar minst ontbrekend met sort_miss = TRUE.

Deze oefening maakt deel uit van de cursus

Omgaan met ontbrekende gegevens in R

Cursus bekijken

Oefeninstructies

Gebruik de riskfactors-gegevensset uit naniar:

  • Gebruik vis_miss() om de ontbrekendheid in de data te visualiseren.
  • Gebruik vis_miss() met cluster = TRUE om clusters van ontbrekendheid te verkennen.
  • Gebruik vis_miss() en sorteer de ontbrekende waarden met sort_miss om de kolommen op ontbrekendheid te rangschikken.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Visualize all of the missingness in the `riskfactors`  dataset
vis_miss(___)

# Visualize and cluster all of the missingness in the `riskfactors` dataset
vis_miss(___, ___ = TRUE)

# visualize and sort the columns by missingness in the `riskfactors` dataset
vis_miss(___, ___ = TRUE)
Code bewerken en uitvoeren