Rechercher des corrélations dans vos données
Identifier les corrélations entre les valeurs manquantes vous aide à mieux comprendre la nature de ces manques et à choisir des méthodes adaptées pour les traiter. Dans la dernière vidéo, vous avez découvert deux techniques essentielles pour détecter visuellement des corrélations entre données manquantes : les cartes thermiques et les dendrogrammes.
Dans cet exercice, vous allez créer une carte thermique et un dendrogramme de la "missingness" pour le jeu de données diabetes en utilisant le paquet missingno. Il a été importé sous le nom msno.
Cet exercice fait partie du cours
Gérer les données manquantes en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import missingno
import missingno as msno
# Plot missingness heatmap of diabetes
___.___(___)
# Show plot
plt.show()