CommencerCommencer gratuitement

Supprimer MCAR

Analyser et traiter correctement les valeurs manquantes est une tâche délicate. Cependant, lorsqu’il y en a très peu, les gérer devient très simple. Dans la vidéo, vous avez appris à bien identifier ces valeurs, à savoir quand les supprimer et comment retirer les données manquantes.

Dans cet exercice, vous allez supprimer en liste complète (listwise deletion) les lignes où la colonne Glucose contient des valeurs manquantes. Le DataFrame diabetes et le package missingno sous l’alias msno ont déjà été chargés pour vous.

Remarque : nous utilisons une fonction propriétaire display() à la place de plt.show() pour faciliter l’affichage du Résultat.

Cet exercice fait partie du cours

Gérer les données manquantes en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Visualize the missingness of diabetes prior to dropping missing values
___

# Display nullity matrix
display("/usr/local/share/datasets/matrix_diabetes.png")
Modifier et exécuter le code