Normalizzazione
Come visto nel video, con la normalizzazione si scala linearmente l’intera colonna tra 0 e 1, dove 0 corrisponde al valore più basso nella colonna e 1 al più alto.
Usando scikit-learn (la libreria di machine learning più utilizzata in Python) puoi usare un MinMaxScaler per applicare la normalizzazione.
(Si chiama così perché scala i valori tra un minimo e un massimo.)
Questo esercizio fa parte del corso
Feature Engineering per il Machine Learning in Python
Istruzioni dell'esercizio
- Importa
MinMaxScalerdal modulopreprocessingdisklearn. - Istanzia
MinMaxScaler()comeMM_scaler. - Esegui il fit del
MinMaxScalersulla colonnaAgediso_numeric_df. - Trasforma la stessa colonna con lo scaler appena adattato.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import MinMaxScaler
____
# Instantiate MinMaxScaler
MM_scaler = ____()
# Fit MM_scaler to the data
____.____(so_numeric_df[['Age']])
# Transform the data using the fitted scaler
so_numeric_df['Age_MM'] = ____.____(so_numeric_df[['Age']])
# Compare the origional and transformed column
print(so_numeric_df[['Age_MM', 'Age']].head())