Gérer l’asymétrie
Nous avons chargé le même jeu de données nommé data. Votre objectif est maintenant de corriger l’asymétrie de var2 et var3, car leur distribution n’était pas symétrique comme vous l’avez vu dans le graphique de l’exercice précédent. Vous allez les visualiser pour vérifier que le problème est résolu.
Les bibliothèques pandas, numpy, seaborn et matplotlib.pyplot ont été chargées sous les alias pd, np, sns et plt. N’hésitez pas à explorer le jeu de données dans la console.
Cet exercice fait partie du cours
Customer Segmentation in Python
Instructions
- Appliquez une transformation logarithmique à
var2et enregistrez-la dans une nouvelle variablevar2_log. - Appliquez une transformation logarithmique à
var3et enregistrez-la dans une nouvelle variablevar3_log. - Tracez la distribution de
var2_log. - Tracez la distribution de
var3_log.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Apply log transformation to var2
data['____'] = np.____(data['____'])
# Apply log transformation to var3
data['____'] = ____.____(____)
# Create a subplot of the distribution of var2_log
plt.____(2, 1, 1); ____.____(data['____'])
# Create a subplot of the distribution of var3_log
plt.____(2, 1, 2); ____.____(data['____'])
# Show the plot
plt.show()