CommencerCommencer gratuitement

Prétraiter les données

La première étape de la segmentation consiste à prétraiter les données. Vous allez appliquer une transformation logarithmique, puis normaliser les données pour les préparer au clustering.

Nous avons chargé le jeu de données avec les valeurs RFMT sous le nom datamart_rfmt. La bibliothèque pandas est disponible sous pd, et numpy sous np.

N’hésitez pas à explorer l’ensemble de données RFMT enrichi dans la console.

Cet exercice fait partie du cours

Customer Segmentation in Python

Afficher le cours

Instructions

  • Importez StandardScaler, initialisez-le et stockez-le dans scaler.
  • Appliquez une transformation logarithmique aux données RFMT brutes.
  • Initialisez le scaler et ajustez-le sur les données transformées en log.
  • Transformez et enregistrez les données normalisées sous datamart_rfmt_normalized.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import StandardScaler 
from ____.____ import ____

# Apply log transformation
datamart_rfmt_log = ____.____(____)

# Initialize StandardScaler and fit it 
scaler = ____(); ____.fit(____)

# Transform and store the scaled data as datamart_rfmt_normalized
datamart_rfmt_normalized = ____.____(____)
Modifier et exécuter le code