Prétraiter les données
La première étape de la segmentation consiste à prétraiter les données. Vous allez appliquer une transformation logarithmique, puis normaliser les données pour les préparer au clustering.
Nous avons chargé le jeu de données avec les valeurs RFMT sous le nom datamart_rfmt. La bibliothèque pandas est disponible sous pd, et numpy sous np.
N’hésitez pas à explorer l’ensemble de données RFMT enrichi dans la console.
Cet exercice fait partie du cours
Customer Segmentation in Python
Instructions
- Importez StandardScaler, initialisez-le et stockez-le dans
scaler. - Appliquez une transformation logarithmique aux données RFMT brutes.
- Initialisez le scaler et ajustez-le sur les données transformées en log.
- Transformez et enregistrez les données normalisées sous
datamart_rfmt_normalized.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import StandardScaler
from ____.____ import ____
# Apply log transformation
datamart_rfmt_log = ____.____(____)
# Initialize StandardScaler and fit it
scaler = ____(); ____.fit(____)
# Transform and store the scaled data as datamart_rfmt_normalized
datamart_rfmt_normalized = ____.____(____)