Normalización
Como se comentó en el vídeo, en la normalización escalas linealmente toda la columna entre 0 y 1, donde 0 corresponde al valor más bajo de la columna y 1 al más alto.
Cuando usas scikit-learn (la biblioteca de Machine Learning más común en Python) puedes aplicar la normalización con un MinMaxScaler.
(Se llama así porque escala tus valores entre un valor mínimo y máximo.)
Este ejercicio forma parte del curso
Ingeniería de características para Machine Learning en Python
Instrucciones del ejercicio
- Importa
MinMaxScalerdel módulopreprocessingdesklearn. - Instancia
MinMaxScaler()comoMM_scaler. - Ajusta el
MinMaxScalersobre la columnaAgedeso_numeric_df. - Transforma esa misma columna con el scaler que acabas de ajustar.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import MinMaxScaler
____
# Instantiate MinMaxScaler
MM_scaler = ____()
# Fit MM_scaler to the data
____.____(so_numeric_df[['Age']])
# Transform the data using the fitted scaler
so_numeric_df['Age_MM'] = ____.____(so_numeric_df[['Age']])
# Compare the origional and transformed column
print(so_numeric_df[['Age_MM', 'Age']].head())