MCAR verwijderen
Het analyseren en correct behandelen van ontbrekende waarden is een lastige klus. Maar als het aantal ontbrekende waarden heel klein is, kun je er eenvoudig mee omgaan. In de video-oefening heb je geleerd hoe je ontbrekende data goed herkent, wanneer je ze moet laten vallen en hoe je ze verwijdert.
In deze oefening verwijder je rijgewijs de rijen waarin de kolom Glucose ontbrekende waarden heeft. De diabetes DataFrame en het missingno-pakket als msno zijn al voor je geladen.
Let op: we gebruiken een eigen display()-functie in plaats van plt.show() om het resultaat makkelijker te kunnen bekijken.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Visualize the missingness of diabetes prior to dropping missing values
___
# Display nullity matrix
display("/usr/local/share/datasets/matrix_diabetes.png")