Gestiona la asimetría
Hemos cargado el mismo conjunto de datos llamado data. Ahora tu objetivo será eliminar la asimetría de var2 y var3, ya que tenían una distribución no simétrica como viste en el gráfico del ejercicio anterior. ¡Las visualizarás para asegurarte de que el problema queda resuelto!
Las librerías pandas, numpy, seaborn y matplotlib.pyplot se han cargado como pd, np, sns y plt, respectivamente. Si quieres, explora el conjunto de datos en la consola.
Este ejercicio forma parte del curso
Segmentación de clientes en Python
Instrucciones del ejercicio
- Aplica una transformación logarítmica a
var2y guárdala como nueva variablevar2_log. - Aplica una transformación logarítmica a
var3y guárdala como nueva variablevar3_log. - Representa la distribución de
var2_log. - Representa la distribución de
var3_log.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Apply log transformation to var2
data['____'] = np.____(data['____'])
# Apply log transformation to var3
data['____'] = ____.____(____)
# Create a subplot of the distribution of var2_log
plt.____(2, 1, 1); ____.____(data['____'])
# Create a subplot of the distribution of var3_log
plt.____(2, 1, 2); ____.____(data['____'])
# Show the plot
plt.show()