CommencerCommencer gratuitement

Vérifier les valeurs manquantes

Identifier les valeurs manquantes est essentiel pour l’analyse. Avec le même jeu de données, vous allez obtenir le nombre total de valeurs manquantes en itérant à la fois sur les lignes et sur les colonnes du jeu de données. Une fois des valeurs manquantes détectées, il faut appliquer d’autres méthodes pour les traiter, par exemple avec Imputer de sklearn. Sans traitement des valeurs manquantes, il sera difficile de réaliser une prédiction de CTR fiable.

Les données d’exemple sous forme de DataFrame sont chargées dans df. pandas en tant que pd est également disponible dans votre espace de travail.

Cet exercice fait partie du cours

Prédire le CTR avec le Machine Learning en Python

Afficher le cours

Instructions

  • Affichez un résumé de base des colonnes avec .info().
  • Affichez les valeurs manquantes par colonne en utilisant .isnull() (n’oubliez pas les parenthèses !).
  • Affichez le nombre total de valeurs manquantes par ligne en utilisant axis = 1 et .sum().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Print info
print(df.____)

# Print missing values by column 
print(df.____.sum(____ = 0))

# Print total number of missing values in rows
print(df.____.sum(____ = 1).____)
Modifier et exécuter le code