Attribuer des labels aux données brutes
Vous allez maintenant analyser les valeurs RFM moyennes des trois clusters que vous avez créés dans l’exercice précédent. Nous avons chargé le jeu de données RFM brut sous le nom datamart_rfm, et les labels de cluster sous cluster_labels. pandas est disponible sous pd.
N’hésitez pas à explorer les données dans la console.
Cet exercice fait partie du cours
Customer Segmentation in Python
Instructions
- Créez un nouveau DataFrame en ajoutant une colonne de label de cluster à
datamart_rfm. - Créez un élément
groupbysur une colonneCluster. - Calculez les valeurs RFM moyennes et la taille des segments pour chaque valeur de
Cluster.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a DataFrame by adding a new cluster label column
datamart_rfm_k3 = datamart_rfm.____(Cluster=cluster_labels)
# Group the data by cluster
grouped = ____.____(['____'])
# Calculate average RFM values and segment sizes per cluster value
grouped.____({
'Recency': '____',
'Frequency': '____',
'MonetaryValue': ['____', '____']
}).round(1)