Imputation par le mode et par constante
Renseigner les valeurs manquantes avec la moyenne, la médiane, une constante ou le mode est particulièrement adapté lorsque vous avez relativement peu de valeurs manquantes. Dans l’exercice précédent, vous avez imputé avec les méthodes de la moyenne et de la médiane. Dans cet exercice, vous allez remplir les valeurs les plus fréquentes de la colonne, puis réaliser une autre imputation en utilisant une valeur constante.
Comme précédemment, le DataFrame diabetes et la fonction SimpleImputer() ont été chargés pour vous.
Cet exercice fait partie du cours
Gérer les données manquantes en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Make a copy of diabetes
diabetes_mode = diabetes.copy(deep=True)
# Create mode imputer object
mode_imputer = SimpleImputer(___=___)
# Impute using most frequent value in the DataFrame mode_imputer
diabetes_mode.iloc[:, :] = mode_imputer.___(___)