CommencerCommencer gratuitement

Gérer l’asymétrie

Nous avons chargé le même jeu de données nommé data. Votre objectif est maintenant de corriger l’asymétrie de var2 et var3, car leur distribution n’était pas symétrique comme vous l’avez vu dans le graphique de l’exercice précédent. Vous allez les visualiser pour vérifier que le problème est résolu.

Les bibliothèques pandas, numpy, seaborn et matplotlib.pyplot ont été chargées sous les alias pd, np, sns et plt. N’hésitez pas à explorer le jeu de données dans la console.

Cet exercice fait partie du cours

Customer Segmentation in Python

Afficher le cours

Instructions

  • Appliquez une transformation logarithmique à var2 et enregistrez-la dans une nouvelle variable var2_log.
  • Appliquez une transformation logarithmique à var3 et enregistrez-la dans une nouvelle variable var3_log.
  • Tracez la distribution de var2_log.
  • Tracez la distribution de var3_log.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Apply log transformation to var2
data['____'] = np.____(data['____'])

# Apply log transformation to var3
data['____'] = ____.____(____)

# Create a subplot of the distribution of var2_log
plt.____(2, 1, 1); ____.____(data['____'])

# Create a subplot of the distribution of var3_log
plt.____(2, 1, 2); ____.____(data['____'])

# Show the plot
plt.show()
Modifier et exécuter le code