LoslegenKostenlos loslegen

Normalisierung

Wie im Video besprochen, skalierst du bei der Normalisierung eine gesamte Spalte linear auf den Bereich von 0 bis 1, wobei 0 dem kleinsten Wert der Spalte entspricht und 1 dem größten.
Mit scikit-learn (der am häufigsten verwendeten Machine-Learning-Bibliothek in Python) kannst du dafür den MinMaxScaler verwenden. (Er heißt so, weil er deine Werte zwischen einem minimalen und einem maximalen Wert skaliert.)

Diese Übung ist Teil des Kurses

Feature Engineering für Machine Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere MinMaxScaler aus dem Modul preprocessing von sklearn.
  • Instanziiere MinMaxScaler() als MM_scaler.
  • Fitte den MinMaxScaler auf die Spalte Age von so_numeric_df.
  • Transformiere dieselbe Spalte mit dem soeben gefitteten Scaler.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import MinMaxScaler
____

# Instantiate MinMaxScaler
MM_scaler = ____()

# Fit MM_scaler to the data
____.____(so_numeric_df[['Age']])

# Transform the data using the fitted scaler
so_numeric_df['Age_MM'] = ____.____(so_numeric_df[['Age']])

# Compare the origional and transformed column
print(so_numeric_df[['Age_MM', 'Age']].head())
Code bearbeiten und ausführen