Centralize e escale com StandardScaler()

Carregamos o mesmo conjunto de dados chamado data. Agora, seu objetivo é centralizar e escalar os dados com o StandardScaler da biblioteca sklearn.

As bibliotecas pandas, numpy, seaborn e matplotlib.pyplot já foram carregadas como pd, np, sns e plt, respectivamente. Também importamos o StandardScaler.

Fique à vontade para explorar o conjunto de dados no console.

Este exercicio faz parte do curso

Segmentação de Clientes em Python

Ver curso

Instruções do exercicio

Inicialize uma instância de StandardScaler como scaler e ajuste-a ao data.
Transforme o data escalonando e centralizando com o scaler.
Crie um DataFrame do pandas a partir de data_normalized, adicionando os nomes de índice e colunas de data.
Imprima as estatísticas resumidas para verificar se a média é zero e o desvio padrão é um, arredondando os resultados para 2 casas decimais.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Initialize a scaler
scaler = ____()

# Fit the scaler
____.____(data)

# Scale and center the data
data_normalized = ____.____(data)

# Create a pandas DataFrame
data_normalized = pd.DataFrame(____, index=data.index, columns=data.columns)

# Print summary statistics
print(data_normalized.____().round(____))

Editar e Executar Código