CommencerCommencer gratuitement

Imputation par le mode et par constante

Renseigner les valeurs manquantes avec la moyenne, la médiane, une constante ou le mode est particulièrement adapté lorsque vous avez relativement peu de valeurs manquantes. Dans l’exercice précédent, vous avez imputé avec les méthodes de la moyenne et de la médiane. Dans cet exercice, vous allez remplir les valeurs les plus fréquentes de la colonne, puis réaliser une autre imputation en utilisant une valeur constante.

Comme précédemment, le DataFrame diabetes et la fonction SimpleImputer() ont été chargés pour vous.

Cet exercice fait partie du cours

Gérer les données manquantes en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Make a copy of diabetes
diabetes_mode = diabetes.copy(deep=True)

# Create mode imputer object
mode_imputer = SimpleImputer(___=___)

# Impute using most frequent value in the DataFrame mode_imputer
diabetes_mode.iloc[:, :] = mode_imputer.___(___)
Modifier et exécuter le code