LoslegenKostenlos starten

Normalisierung

Wie im Video besprochen, skalierst du bei der Normalisierung eine gesamte Spalte linear auf den Bereich von 0 bis 1, wobei 0 dem kleinsten Wert der Spalte entspricht und 1 dem größten.
Mit scikit-learn (der am häufigsten verwendeten Machine-Learning-Bibliothek in Python) kannst du dafür den MinMaxScaler verwenden. (Er heißt so, weil er deine Werte zwischen einem minimalen und einem maximalen Wert skaliert.)

Diese Übung ist Teil des Kurses

<Kurs>Feature Engineering für Machine Learning in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Importiere MinMaxScaler aus dem Modul preprocessing von sklearn.
  • Instanziiere MinMaxScaler() als MM_scaler.
  • Fitte den MinMaxScaler auf die Spalte Age von so_numeric_df.
  • Transformiere dieselbe Spalte mit dem soeben gefitteten Scaler.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import MinMaxScaler
____

# Instantiate MinMaxScaler
MM_scaler = ____()

# Fit MM_scaler to the data
____.____(so_numeric_df[['Age']])

# Transform the data using the fitted scaler
so_numeric_df['Age_MM'] = ____.____(so_numeric_df[['Age']])

# Compare the origional and transformed column
print(so_numeric_df[['Age_MM', 'Age']].head())
Code bearbeiten und ausführen