CommencerCommencer gratuitement

Imputation itérative

Dans l’exercice précédent, vous avez imputé les valeurs manquantes de loan_data par la moyenne. Cependant, lors d’un entretien en Machine Learning, on vous interrogera probablement sur des techniques d’imputation plus dynamiques qui s’appuient sur d’autres variables du jeu de données.

Dans cet exercice, vous allez pratiquer une approche basée sur le Machine Learning en imputant les valeurs manquantes en fonction des autres variables à l’aide de IterativeImputer() de sklearn.impute. Il s’agit d’un imputeur multivarié qui estime chaque variable à partir de toutes les autres, de manière « round-robin ».

Notez que cette fonction est considérée comme expérimentale ; veuillez consulter la documentation pour plus d’informations.

Vous en êtes au même endroit dans le Pipeline :

Machine learning pipeline

Cet exercice fait partie du cours

S’entraîner aux questions d’entretien en Machine Learning avec Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Explicitly require this experimental feature
from sklearn.experimental import enable_iterative_imputer
# Now you can import normally from sklearn.impute
from sklearn.impute import IterativeImputer

# Subset numeric features: numeric_cols
numeric_cols = ____.____(____=[____.____])
Modifier et exécuter le code