Vérifier les valeurs manquantes
Identifier les valeurs manquantes est essentiel pour l’analyse. Avec le même jeu de données, vous allez obtenir le nombre total de valeurs manquantes en itérant à la fois sur les lignes et sur les colonnes du jeu de données. Une fois des valeurs manquantes détectées, il faut appliquer d’autres méthodes pour les traiter, par exemple avec Imputer de sklearn. Sans traitement des valeurs manquantes, il sera difficile de réaliser une prédiction de CTR fiable.
Les données d’exemple sous forme de DataFrame sont chargées dans df. pandas en tant que pd est également disponible dans votre espace de travail.
Cet exercice fait partie du cours
Prédire le CTR avec le Machine Learning en Python
Instructions
- Affichez un résumé de base des colonnes avec
.info(). - Affichez les valeurs manquantes par colonne en utilisant
.isnull()(n’oubliez pas les parenthèses !). - Affichez le nombre total de valeurs manquantes par ligne en utilisant
axis = 1et.sum().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Print info
print(df.____)
# Print missing values by column
print(df.____.sum(____ = 0))
# Print total number of missing values in rows
print(df.____.sum(____ = 1).____)