CommencerCommencer gratuitement

Préparer les données pour le snake plot

Vous allez maintenant préparer les données pour le snake plot. Vous utiliserez la segmentation RFM en 3 clusters que vous avez construite précédemment. Vous allez transformer les données RFM normalisées en un format long en « fondant » les colonnes de métriques en deux colonnes : l’une pour le nom de la métrique, l’autre pour la valeur numérique.

Nous avons chargé les données RFM normalisées avec les étiquettes de cluster déjà affectées. Elles sont chargées dans un DataFrame pandas nommé datamart_normalized. De plus, pandas est importé sous l’alias pd.

Explorez datamart_normalized dans la console avant de commencer l’exercice pour bien comprendre sa structure !

Cet exercice fait partie du cours

Customer Segmentation in Python

Afficher le cours

Instructions

  • Transformez le jeu de données en format long en appliquant la fonction melt sur le jeu de données normalisé après avoir réinitialisé l’index.
  • Définissez CustomerID et Cluster comme variables d’identifiant (ID).
  • Définissez les valeurs RFM comme variables de valeur.
  • Nommez la variable Metric et la valeur Value.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Melt the normalized dataset and reset the index
datamart_melt = pd.____(
  					____.____(), 
                        
# Assign CustomerID and Cluster as ID variables
                    ____=['____', '____'],

# Assign RFM values as value variables
                    ____=['____', '____', '____'], 
                        
# Name the variable and value
                    ____='____', ____='____'
					)
Modifier et exécuter le code