ComeçarComece de graça

Normalize as variáveis

Agora, o último passo da preparação dos dados. Você vai transformar o conjunto de dados sem assimetria wholesale_boxcox para a mesma escala, ou seja, todas as colunas terão média zero e desvio padrão igual a 1. Para isso, você usará a função StandardScaler do módulo sklearn.preprocessing.

O conjunto de dados sem assimetria wholesale_coxbox que você transformou no exercício anterior foi importado como um DataFrame do pandas. Além disso, a instância StandardScaler() já foi inicializada como scaler.

Este exercício faz parte do curso

Machine Learning para Marketing em Python

Ver curso

Instruções do exercício

  • Faça o ajuste (fit) da instância scaler inicializada no conjunto de dados transformado por Box-Cox.
  • Transforme e armazene o conjunto de dados escalonado como wholesale_scaled.
  • Crie um DataFrame do pandas a partir do conjunto de dados escalonado.
  • Imprima a média e o desvio padrão de todas as colunas.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Fit the initialized `scaler` instance on the Box-Cox transformed dataset
scaler.___(wholesale_boxcox)

# Transform and store the scaled dataset as `wholesale_scaled`
wholesale_scaled = scaler.___(wholesale_boxcox)

# Create a `pandas` DataFrame from the scaled dataset
wholesale_scaled_df = pd.DataFrame(data=___,
                                       index=wholesale_boxcox.___,
                                       columns=wholesale_boxcox.columns)

# Print the mean and standard deviation for all columns
print(wholesale_scaled_df.agg(['___','std']).round())
Editar e executar o código