Supprimer MCAR
Analyser et traiter correctement les valeurs manquantes est une tâche délicate. Cependant, lorsqu’il y en a très peu, les gérer devient très simple. Dans la vidéo, vous avez appris à bien identifier ces valeurs, à savoir quand les supprimer et comment retirer les données manquantes.
Dans cet exercice, vous allez supprimer en liste complète (listwise deletion) les lignes où la colonne Glucose contient des valeurs manquantes. Le DataFrame diabetes et le package missingno sous l’alias msno ont déjà été chargés pour vous.
Remarque : nous utilisons une fonction propriétaire display() à la place de plt.show() pour faciliter l’affichage du Résultat.
Cet exercice fait partie du cours
Gérer les données manquantes en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Visualize the missingness of diabetes prior to dropping missing values
___
# Display nullity matrix
display("/usr/local/share/datasets/matrix_diabetes.png")