CommencerCommencer gratuitement

Imputation MICE

Le package fancyimpute propose plusieurs modèles de Machine Learning robustes pour imputer les valeurs manquantes. Vous pouvez consulter la liste complète des estimateurs d’imputation dans la documentation. Ici, nous utiliserons IterativeImputer, plus connu sous le nom de MICE, pour imputer les valeurs manquantes.

IterativeImputer réalise des régressions multiples sur des échantillons aléatoires des données, puis agrège les résultats pour imputer les valeurs manquantes. Vous utiliserez le DataFrame diabetes pour effectuer cette imputation.

Cet exercice fait partie du cours

Gérer les données manquantes en Python

Afficher le cours

Instructions

  • Importez IterativeImputer depuis fancyimpute.
  • Copiez diabetes dans diabetes_mice_imputed.
  • Créez un objet IterativeImputer() et affectez-le à mice_imputer.
  • Imputez le DataFrame diabetes_mice_imputed.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import IterativeImputer from fancyimpute
___

# Copy diabetes to diabetes_mice_imputed
diabetes_mice_imputed = ___

# Initialize IterativeImputer
mice_imputer = ___

# Impute using fit_tranform on diabetes_mice_imputed
diabetes_mice_imputed.iloc[:, :] = ___
Modifier et exécuter le code