Aan de slagGa gratis aan de slag

Ontbrekende beleggers

Omgaan met missende data is een van de meest voorkomende taken in data science. Er zijn verschillende soorten ontbrekende waarden, en ook verschillende manieren om ermee om te gaan.

Je hebt zojuist een nieuwe versie van de banking-DataFrame gekregen met gegevens over het bedrag op rekeningen en belegd vermogen voor nieuwe en bestaande klanten. Er zijn echter rijen met missende waarden in inv_amount.

Je weet zeker dat de meeste klanten onder de 25 nog geen beleggingsrekening hebben, en vermoedt dat dit de missendheid kan verklaren. De pakketten pandas, missingno en matplotlib.pyplot zijn respectievelijk als pd, msno en plt geïmporteerd. De DataFrame banking staat in je omgeving.

Deze oefening maakt deel uit van de cursus

Data opschonen in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Print number of missing values in banking
print(____)

# Visualize missingness matrix
____
____
Code bewerken en uitvoeren