ComeçarComece de graça

Tratar assimetria

Carregamos o mesmo conjunto de dados chamado data. Agora, seu objetivo é remover a assimetria de var2 e var3, pois elas tinham distribuição não simétrica, como você viu no gráfico do exercício anterior. Você vai visualizá-las para garantir que o problema foi resolvido!

As bibliotecas pandas, numpy, seaborn e matplotlib.pyplot já foram carregadas como pd, np, sns e plt, respectivamente. Fique à vontade para explorar o conjunto de dados no console.

Este exercício faz parte do curso

Segmentação de Clientes em Python

Ver curso

Instruções do exercício

  • Aplique uma transformação logarítmica em var2 e salve como a nova variável var2_log.
  • Aplique uma transformação logarítmica em var3 e salve como a nova variável var3_log.
  • Plote a distribuição de var2_log.
  • Plote a distribuição de var3_log.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Apply log transformation to var2
data['____'] = np.____(data['____'])

# Apply log transformation to var3
data['____'] = ____.____(____)

# Create a subplot of the distribution of var2_log
plt.____(2, 1, 1); ____.____(data['____'])

# Create a subplot of the distribution of var3_log
plt.____(2, 1, 2); ____.____(data['____'])

# Show the plot
plt.show()
Editar e executar o código