Normalisierung
Wie im Video besprochen, skalierst du bei der Normalisierung eine gesamte Spalte linear auf den Bereich von 0 bis 1, wobei 0 dem kleinsten Wert der Spalte entspricht und 1 dem größten.
Mit scikit-learn (der am häufigsten verwendeten Machine-Learning-Bibliothek in Python) kannst du dafür den MinMaxScaler verwenden.
(Er heißt so, weil er deine Werte zwischen einem minimalen und einem maximalen Wert skaliert.)
Diese Übung ist Teil des Kurses
<Kurs>Feature Engineering für Machine Learning in Python</Kurs>Übungsanweisungen
- Importiere
MinMaxScaleraus dem Modulpreprocessingvonsklearn. - Instanziiere
MinMaxScaler()alsMM_scaler. - Fitte den
MinMaxScalerauf die SpalteAgevonso_numeric_df. - Transformiere dieselbe Spalte mit dem soeben gefitteten Scaler.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import MinMaxScaler
____
# Instantiate MinMaxScaler
MM_scaler = ____()
# Fit MM_scaler to the data
____.____(so_numeric_df[['Age']])
# Transform the data using the fitted scaler
so_numeric_df['Age_MM'] = ____.____(so_numeric_df[['Age']])
# Compare the origional and transformed column
print(so_numeric_df[['Age_MM', 'Age']].head())