ComeçarComece de graça

Centralize e escale com StandardScaler()

Carregamos o mesmo conjunto de dados chamado data. Agora, seu objetivo é centralizar e escalar os dados com o StandardScaler da biblioteca sklearn.

As bibliotecas pandas, numpy, seaborn e matplotlib.pyplot já foram carregadas como pd, np, sns e plt, respectivamente. Também importamos o StandardScaler.

Fique à vontade para explorar o conjunto de dados no console.

Este exercício faz parte do curso

Segmentação de Clientes em Python

Ver curso

Instruções do exercício

  • Inicialize uma instância de StandardScaler como scaler e ajuste-a ao data.
  • Transforme o data escalonando e centralizando com o scaler.
  • Crie um DataFrame do pandas a partir de data_normalized, adicionando os nomes de índice e colunas de data.
  • Imprima as estatísticas resumidas para verificar se a média é zero e o desvio padrão é um, arredondando os resultados para 2 casas decimais.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Initialize a scaler
scaler = ____()

# Fit the scaler
____.____(data)

# Scale and center the data
data_normalized = ____.____(data)

# Create a pandas DataFrame
data_normalized = pd.DataFrame(____, index=data.index, columns=data.columns)

# Print summary statistics
print(data_normalized.____().round(____))
Editar e executar o código