Einfache Imputation
Wie du in der letzten Übung gesehen hast, kann das Löschen von Daten deinen Datensatz zu stark verkleinern. In einem Bewerbungsgespräch kann das zu verzerrten Ergebnissen deines Machine-Learning-Modells führen.
Eine flexiblere Methode zum Umgang mit fehlenden Werten ist ihre Imputation. Es gibt verschiedene Möglichkeiten, dies in Python zu tun. In dieser Übung verwendest du die Funktion SimpleImputer() aus dem Modul sklearn.impute auf loan_data.
Anschließend nutzt du pandas und numpy, um den imputierten Datensatz in ein DataFrame umzuwandeln.
Beachte, dass nun 2 Schritte zur Pipeline hinzugefügt werden: Instantiate und Fit:

Diese Übung ist Teil des Kurses
<Kurs>ML-Vorstellungsgespräche in Python üben</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import imputer module
from sklearn.impute import SimpleImputer
# Subset numeric features: numeric_cols
numeric_cols = ____.____(include=[____.____])