Normalisierung
Wie im Video besprochen, skalierst du bei der Normalisierung eine gesamte Spalte linear auf den Bereich von 0 bis 1, wobei 0 dem kleinsten Wert der Spalte entspricht und 1 dem größten.
Mit scikit-learn (der am häufigsten verwendeten Machine-Learning-Bibliothek in Python) kannst du dafür den MinMaxScaler verwenden.
(Er heißt so, weil er deine Werte zwischen einem minimalen und einem maximalen Wert skaliert.)
Diese Übung ist Teil des Kurses
Feature Engineering für Machine Learning in Python
Anleitung zur Übung
- Importiere
MinMaxScaleraus dem Modulpreprocessingvonsklearn. - Instanziiere
MinMaxScaler()alsMM_scaler. - Fitte den
MinMaxScalerauf die SpalteAgevonso_numeric_df. - Transformiere dieselbe Spalte mit dem soeben gefitteten Scaler.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import MinMaxScaler
____
# Instantiate MinMaxScaler
MM_scaler = ____()
# Fit MM_scaler to the data
____.____(so_numeric_df[['Age']])
# Transform the data using the fitted scaler
so_numeric_df['Age_MM'] = ____.____(so_numeric_df[['Age']])
# Compare the origional and transformed column
print(so_numeric_df[['Age_MM', 'Age']].head())