Einfache Imputation

Wie du in der letzten Übung gesehen hast, kann das Löschen von Daten deinen Datensatz zu stark verkleinern. In einem Bewerbungsgespräch kann das zu verzerrten Ergebnissen deines Machine-Learning-Modells führen.

Eine flexiblere Methode zum Umgang mit fehlenden Werten ist ihre Imputation. Es gibt verschiedene Möglichkeiten, dies in Python zu tun. In dieser Übung verwendest du die Funktion SimpleImputer() aus dem Modul sklearn.impute auf loan_data.

Anschließend nutzt du pandas und numpy, um den imputierten Datensatz in ein DataFrame umzuwandeln.

Beachte, dass nun 2 Schritte zur Pipeline hinzugefügt werden: Instantiate und Fit: Machine learning pipeline

Diese Übung ist Teil des Kurses

<Kurs>ML-Vorstellungsgespräche in Python üben</Kurs>

Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import imputer module
from sklearn.impute import SimpleImputer

# Subset numeric features: numeric_cols
numeric_cols = ____.____(include=[____.____])

Code bearbeiten und ausführen