Z-Score-Standardisierung

In der letzten Übung hast du den Z-Score berechnet, um Ausreißer zu behandeln. In einem Machine-Learning-Interview könnte eine weitere Frage sein, wo Z-Scores sonst noch verwendet werden. Häufig nutzt man sie, um Daten vor dem Erstellen eines Modells zu skalieren.

In dieser Übung verwendest du eine Funktion aus sklearn.preprocessing, die im Video vorgestellt wurde, um die numerischen Feature-Spalten im Datensatz loan_data zu standardisieren. Denk daran: Dabei werden die Daten so skaliert, dass sie einen Mittelwert von 0 und eine Standardabweichung von 1 haben.

Das Modul sklearn.preprocessing wurde bereits für dich importiert.

Pipeline-Überblick:

Machine learning pipeline

Diese Übung ist Teil des Kurses

<Kurs>ML-Vorstellungsgespräche in Python üben</Kurs>

Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Subset features
numeric_cols = ____.____(include=[____.____])
categoric_cols = ____.____(include=[____])

Code bearbeiten und ausführen