Traiter les données manquantes
Imputons des données manquantes sur un vrai jeu de données Kaggle. Pour cela, vous utiliserez un sous-échantillon des données de la compétition Kaggle "Two sigma connect: rental listing inquiries".
Avant toute imputation, vous devez connaître le nombre de valeurs manquantes pour chacune des variables. De plus, si une variable contient des valeurs manquantes, vous devriez examiner le type de cette variable.
Cet exercice fait partie du cours
Gagner une compétition Kaggle en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Read dataframe
twosigma = ____
# Find the number of missing values in each column
print(____.____().____())