À quel point mes données sont-elles clairsemées ?
La plupart des jeux de données contiennent des valeurs manquantes, souvent représentées par NaN (Not a Number). Avec Pandas, vous pouvez facilement vérifier combien de valeurs manquantes il y a dans chaque colonne.
Voyons combien de personnes développeuses ayant répondu à l’enquête ont choisi d’indiquer leur âge (colonne Age de so_survey_df) et leur genre (colonne Gender de so_survey_df).
Cet exercice fait partie du cours
Feature engineering pour le Machine Learning en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Subset the DataFrame
sub_df = ____
# Print the number of non-missing values
print(sub_df.____)