Tratar assimetria
Carregamos o mesmo conjunto de dados chamado data. Agora, seu objetivo é remover a assimetria de var2 e var3, pois elas tinham distribuição não simétrica, como você viu no gráfico do exercício anterior. Você vai visualizá-las para garantir que o problema foi resolvido!
As bibliotecas pandas, numpy, seaborn e matplotlib.pyplot já foram carregadas como pd, np, sns e plt, respectivamente. Fique à vontade para explorar o conjunto de dados no console.
Este exercício faz parte do curso
Segmentação de Clientes em Python
Instruções do exercício
- Aplique uma transformação logarítmica em
var2e salve como a nova variávelvar2_log. - Aplique uma transformação logarítmica em
var3e salve como a nova variávelvar3_log. - Plote a distribuição de
var2_log. - Plote a distribuição de
var3_log.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Apply log transformation to var2
data['____'] = np.____(data['____'])
# Apply log transformation to var3
data['____'] = ____.____(____)
# Create a subplot of the distribution of var2_log
plt.____(2, 1, 1); ____.____(data['____'])
# Create a subplot of the distribution of var3_log
plt.____(2, 1, 2); ____.____(data['____'])
# Show the plot
plt.show()