Imputation MICE
Le package fancyimpute propose plusieurs modèles de Machine Learning robustes pour imputer les valeurs manquantes. Vous pouvez consulter la liste complète des estimateurs d’imputation dans la documentation. Ici, nous utiliserons IterativeImputer, plus connu sous le nom de MICE, pour imputer les valeurs manquantes.
IterativeImputer réalise des régressions multiples sur des échantillons aléatoires des données, puis agrège les résultats pour imputer les valeurs manquantes. Vous utiliserez le DataFrame diabetes pour effectuer cette imputation.
Cet exercice fait partie du cours
Gérer les données manquantes en Python
Instructions
- Importez
IterativeImputerdepuisfancyimpute. - Copiez
diabetesdansdiabetes_mice_imputed. - Créez un objet
IterativeImputer()et affectez-le àmice_imputer. - Imputez le DataFrame
diabetes_mice_imputed.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import IterativeImputer from fancyimpute
___
# Copy diabetes to diabetes_mice_imputed
diabetes_mice_imputed = ___
# Initialize IterativeImputer
mice_imputer = ___
# Impute using fit_tranform on diabetes_mice_imputed
diabetes_mice_imputed.iloc[:, :] = ___