Imputation simple
Comme vous l’avez vu dans l’exercice précédent, supprimer des données peut réduire votre jeu de données de façon excessive. En entretien, cela peut conduire à des résultats biaisés pour votre modèle de Machine Learning.
Une manière plus souple de gérer les valeurs manquantes consiste à les imputer. Il existe plusieurs approches en Python, mais dans cet exercice vous allez utiliser la fonction SimpleImputer() du module sklearn.impute sur loan_data.
Vous utiliserez ensuite pandas et numpy pour convertir le jeu de données imputé en DataFrame.
Notez que deux étapes sont maintenant ajoutées au pipeline, Instantiate et Fit :

Cet exercice fait partie du cours
S’entraîner aux questions d’entretien en Machine Learning avec Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import imputer module
from sklearn.impute import SimpleImputer
# Subset numeric features: numeric_cols
numeric_cols = ____.____(include=[____.____])