CommencerCommencez gratuitement

Rechercher des corrélations dans vos données

Identifier les corrélations entre les valeurs manquantes vous aide à mieux comprendre la nature de ces manques et à choisir des méthodes adaptées pour les traiter. Dans la dernière vidéo, vous avez découvert deux techniques essentielles pour détecter visuellement des corrélations entre données manquantes : les cartes thermiques et les dendrogrammes.

Dans cet exercice, vous allez créer une carte thermique et un dendrogramme de la "missingness" pour le jeu de données diabetes en utilisant le paquet missingno. Il a été importé sous le nom msno.

Cet exercice fait partie du cours

<cours>Gérer les données manquantes en Python</cours>
Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import missingno
import missingno as msno

# Plot missingness heatmap of diabetes
___.___(___)

# Show plot
plt.show()
Modifier et exécuter le code