CommencerCommencer gratuitement

Imputation par moyenne et médiane

L’imputation des valeurs manquantes est souvent la meilleure approche lorsque vous avez de grands volumes de données. Les méthodes les plus simples consistent à renseigner une constante, la moyenne de la variable, ou d’autres paramètres statistiques de base comme la médiane et le mode.

Dans cet exercice, vous allez imputer les valeurs manquantes avec la moyenne puis la médiane pour chacune des colonnes. Le DataFrame diabetes a été chargé pour vous. SimpleImputer() de sklearn.impute a également été importé pour que vous puissiez l’utiliser.

Cet exercice fait partie du cours

Gérer les données manquantes en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Make a copy of diabetes
diabetes_mean = diabetes.copy(deep=True)

# Create mean imputer object
mean_imputer = SimpleImputer(___=___)

# Impute mean values in the DataFrame diabetes_mean
diabetes_mean.iloc[:, :] = mean_imputer.___(___)
Modifier et exécuter le code