Est-ce manquant de manière aléatoire ?
Vous avez observé dans l'exercice vidéo qu'il existe différents types de données manquantes lors de l'observation de données manquantes. À titre de rappel, les types de données manquantes peuvent être décrits comme suit :
- Disparu de manière totalement aléatoire : Il n'existe aucune relation systématique entre les valeurs manquantes d'une colonne et les autres valeurs ou ses propres valeurs.
- Disparu au hasard : Il existe une relation systématique entre les valeurs manquantes d'une colonne et les autres valeurs observées.
- Absence non aléatoire : Il existe une relation systématique entre les valeurs manquantes d'une colonne et les valeurs non observées.
Vous disposez d'un DataFrame contenant les notes de satisfaction client pour un service. De quel type de données manquantes s'agit-il dans le cas suivant ?
Une colonne client satisfaction_score
avec des valeurs manquantes pour les clients très insatisfaits.
Cet exercice fait partie du cours
Nettoyage des données en Python
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
