CommencerCommencer gratuitement

Attribuer des labels aux données brutes

Vous allez maintenant analyser les valeurs RFM moyennes des trois clusters que vous avez créés dans l’exercice précédent. Nous avons chargé le jeu de données RFM brut sous le nom datamart_rfm, et les labels de cluster sous cluster_labels. pandas est disponible sous pd.

N’hésitez pas à explorer les données dans la console.

Cet exercice fait partie du cours

Customer Segmentation in Python

Afficher le cours

Instructions

  • Créez un nouveau DataFrame en ajoutant une colonne de label de cluster à datamart_rfm.
  • Créez un élément groupby sur une colonne Cluster.
  • Calculez les valeurs RFM moyennes et la taille des segments pour chaque valeur de Cluster.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a DataFrame by adding a new cluster label column
datamart_rfm_k3 = datamart_rfm.____(Cluster=cluster_labels)

# Group the data by cluster
grouped = ____.____(['____'])

# Calculate average RFM values and segment sizes per cluster value
grouped.____({
    'Recency': '____',
    'Frequency': '____',
    'MonetaryValue': ['____', '____']
  }).round(1)
Modifier et exécuter le code