Préparer les données pour le snake plot
Vous allez maintenant préparer les données pour le snake plot. Vous utiliserez la segmentation RFM en 3 clusters que vous avez construite précédemment. Vous allez transformer les données RFM normalisées en un format long en « fondant » les colonnes de métriques en deux colonnes : l’une pour le nom de la métrique, l’autre pour la valeur numérique.
Nous avons chargé les données RFM normalisées avec les étiquettes de cluster déjà affectées. Elles sont chargées dans un DataFrame pandas nommé datamart_normalized. De plus, pandas est importé sous l’alias pd.
Explorez datamart_normalized dans la console avant de commencer l’exercice pour bien comprendre sa structure !
Cet exercice fait partie du cours
Customer Segmentation in Python
Instructions
- Transformez le jeu de données en format long en appliquant la fonction
meltsur le jeu de données normalisé après avoir réinitialisé l’index. - Définissez
CustomerIDetClustercomme variables d’identifiant (ID). - Définissez les valeurs RFM comme variables de valeur.
- Nommez la variable
Metricet la valeurValue.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Melt the normalized dataset and reset the index
datamart_melt = pd.____(
____.____(),
# Assign CustomerID and Cluster as ID variables
____=['____', '____'],
# Assign RFM values as value variables
____=['____', '____', '____'],
# Name the variable and value
____='____', ____='____'
)