Ontbrekende data visualiseren
Werken met ontbrekende waarden is een van de meest voorkomende taken in data science. Er zijn verschillende soorten ontbrekendheid, en ook verschillende manieren om ermee om te gaan.
Je hebt net een nieuwe versie van de accounts-dataframe gekregen met gegevens over het aangehouden bedrag en het geïnvesteerde bedrag voor nieuwe en bestaande klanten. Er zijn echter rijen met ontbrekende waarden voor inv_amount.
Je weet zeker dat de meeste klanten jonger dan 25 nog geen beleggingsrekening hebben, en je vermoedt dat dit de ontbrekendheid kan veroorzaken. De pakketten dplyr en visdat zijn geladen en accounts is beschikbaar.
Deze oefening maakt deel uit van de cursus
Data opschonen in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Visualize the missing values by column
___