Centralize e escale com StandardScaler()
Carregamos o mesmo conjunto de dados chamado data. Agora, seu objetivo é centralizar e escalar os dados com o StandardScaler da biblioteca sklearn.
As bibliotecas pandas, numpy, seaborn e matplotlib.pyplot já foram carregadas como pd, np, sns e plt, respectivamente. Também importamos o StandardScaler.
Fique à vontade para explorar o conjunto de dados no console.
Este exercício faz parte do curso
Segmentação de Clientes em Python
Instruções do exercício
- Inicialize uma instância de
StandardScalercomoscalere ajuste-a aodata. - Transforme o
dataescalonando e centralizando com oscaler. - Crie um DataFrame do pandas a partir de
data_normalized, adicionando os nomes de índice e colunas dedata. - Imprima as estatísticas resumidas para verificar se a média é zero e o desvio padrão é um, arredondando os resultados para 2 casas decimais.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Initialize a scaler
scaler = ____()
# Fit the scaler
____.____(data)
# Scale and center the data
data_normalized = ____.____(data)
# Create a pandas DataFrame
data_normalized = pd.DataFrame(____, index=data.index, columns=data.columns)
# Print summary statistics
print(data_normalized.____().round(____))