Normalize as variáveis
Agora, o último passo da preparação dos dados. Você vai transformar o conjunto de dados sem assimetria wholesale_boxcox para a mesma escala, ou seja, todas as colunas terão média zero e desvio padrão igual a 1. Para isso, você usará a função StandardScaler do módulo sklearn.preprocessing.
O conjunto de dados sem assimetria wholesale_coxbox que você transformou no exercício anterior foi importado como um DataFrame do pandas. Além disso, a instância StandardScaler() já foi inicializada como scaler.
Este exercício faz parte do curso
Machine Learning para Marketing em Python
Instruções do exercício
- Faça o ajuste (fit) da instância
scalerinicializada no conjunto de dados transformado por Box-Cox. - Transforme e armazene o conjunto de dados escalonado como
wholesale_scaled. - Crie um DataFrame do
pandasa partir do conjunto de dados escalonado. - Imprima a média e o desvio padrão de todas as colunas.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Fit the initialized `scaler` instance on the Box-Cox transformed dataset
scaler.___(wholesale_boxcox)
# Transform and store the scaled dataset as `wholesale_scaled`
wholesale_scaled = scaler.___(wholesale_boxcox)
# Create a `pandas` DataFrame from the scaled dataset
wholesale_scaled_df = pd.DataFrame(data=___,
index=wholesale_boxcox.___,
columns=wholesale_boxcox.columns)
# Print the mean and standard deviation for all columns
print(wholesale_scaled_df.agg(['___','std']).round())