Aan de slagGa gratis aan de slag

Normalisatie

Zoals in de video besproken schaal je bij normalisatie een volledige kolom lineair tussen 0 en 1, waarbij 0 overeenkomt met de laagste waarde in de kolom en 1 met de hoogste.
Met scikit-learn (de meest gebruikte Machine Learning-bibliotheek in Python) kun je een MinMaxScaler gebruiken om normalisatie toe te passen. (Hij heet zo omdat je waarden worden geschaald tussen een minimum- en maximumwaarde.)

Deze oefening maakt deel uit van de cursus

Feature engineering voor Machine Learning in Python

Cursus bekijken

Oefeninstructies

  • Importeer MinMaxScaler uit de module preprocessing van sklearn.
  • Instantier MinMaxScaler() als MM_scaler.
  • Fit de MinMaxScaler op de kolom Age van so_numeric_df.
  • Transformeer dezelfde kolom met de scaler die je zojuist hebt gefit.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import MinMaxScaler
____

# Instantiate MinMaxScaler
MM_scaler = ____()

# Fit MM_scaler to the data
____.____(so_numeric_df[['Age']])

# Transform the data using the fitted scaler
so_numeric_df['Age_MM'] = ____.____(so_numeric_df[['Age']])

# Compare the origional and transformed column
print(so_numeric_df[['Age_MM', 'Age']].head())
Code bewerken en uitvoeren