ComeçarComece de graça

Normalização

Como discutido no vídeo, na normalização você escala linearmente toda a coluna entre 0 e 1, sendo 0 o menor valor da coluna e 1 o maior.
Ao usar o scikit-learn (a biblioteca de Machine Learning mais utilizada em Python), você pode usar um MinMaxScaler para aplicar a normalização. (Esse nome vem do fato de que ele escala seus valores entre um valor mínimo e um máximo.)

Este exercício faz parte do curso

Feature Engineering for Machine Learning in Python

Ver curso

Instruções do exercício

  • Importe MinMaxScaler do módulo preprocessing do sklearn.
  • Instancie MinMaxScaler() como MM_scaler.
  • Faça o fit do MinMaxScaler na coluna Age de so_numeric_df.
  • Transforme a mesma coluna com o scaler que você acabou de ajustar.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import MinMaxScaler
____

# Instantiate MinMaxScaler
MM_scaler = ____()

# Fit MM_scaler to the data
____.____(so_numeric_df[['Age']])

# Transform the data using the fitted scaler
so_numeric_df['Age_MM'] = ____.____(so_numeric_df[['Age']])

# Compare the origional and transformed column
print(so_numeric_df[['Age_MM', 'Age']].head())
Editar e executar o código