Deviner le type de valeurs manquantes
Analyser le type de valeurs manquantes vous aide à déduire les meilleures façons de gérer les données manquantes. Le jeu de données sur le diabète des Indiens Pima est très connu pour contenir des valeurs manquantes. Les Indiens Pima sont un groupe ethnique plus sujet au diabète. Le jeu de données regroupe plusieurs examens de laboratoire réalisés auprès des membres de cette communauté.
Dans la vidéo, vous avez appris les 3 types de schémas de valeurs manquantes. Dans cet exercice, vous allez d’abord visualiser le résumé des valeurs manquantes, puis identifier les types de valeurs manquantes présents dans le DataFrame.
Le DataFrame a déjà été chargé sous le nom diabetes.
Notez que nous avons utilisé une fonction propriétaire display() à la place de plt.show() pour vous faciliter la visualisation du résultat.
Cet exercice fait partie du cours
Gérer les données manquantes en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import missingno as msno
___
# Visualize the missingness summary
___
# Display nullity matrix
display("/usr/local/share/datasets/matrix_diabetes.png")