Centralizar e escalar manualmente
Carregamos o mesmo conjunto de dados chamado data. Agora, seu objetivo é centralizar e escalar os dados manualmente.
As bibliotecas pandas, numpy, seaborn e matplotlib.pyplot já foram carregadas como pd, np, sns e plt, respectivamente. Fique à vontade para explorar o conjunto de dados no console.
Este exercício faz parte do curso
Segmentação de Clientes em Python
Instruções do exercício
- Centralize os dados subtraindo os valores médios de cada entrada.
- Escale os dados dividindo cada entrada pelo desvio padrão.
- Combine as duas ações acima e normalize os dados aplicando tanto a centralização quanto a escala.
- Imprima as estatísticas de resumo para verificar se a média é zero e o desvio padrão é um, e arredonde a saída para 2 casas decimais.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Center the data by subtracting average values from each entry
data_centered = data - data.____()
# Scale the data by dividing each entry by standard deviation
data_scaled = ____ / ____.____()
# Normalize the data by applying both centering and scaling
data_normalized = (____ - data.____()) / data.____()
# Print summary statistics to make sure average is zero and standard deviation is one
print(data_normalized.____().round(____))