CommencerCommencer gratuitement

Calculer l'importance relative de chaque attribut

Vous allez maintenant calculer l'importance relative des valeurs RFM au sein de chaque cluster.

Nous avons chargé datamart_rfm avec les valeurs RFM brutes, et datamart_rfm_k3 qui contient les valeurs RFM brutes et les étiquettes de cluster stockées dans Cluster. La bibliothèque pandas est également chargée sous le nom pd.

N'hésitez pas à explorer les jeux de données dans la console.

Cet exercice fait partie du cours

Customer Segmentation in Python

Afficher le cours

Instructions

  • Calculez les valeurs RFM moyennes pour chaque cluster : utilisez le jeu de données datamart_rfm_k3.
  • Calculez les valeurs RFM moyennes pour l'ensemble de la population de clients : utilisez le jeu de données datamart_rfm.
  • Calculez l'importance relative de la valeur de l'attribut du cluster par rapport à la population.
  • Affichez les scores d'importance relative arrondis à 2 décimales.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Calculate average RFM values for each cluster
cluster_avg = ____.groupby(['____']).____() 

# Calculate average RFM values for the total customer population
population_avg = ____.____()

# Calculate relative importance of cluster's attribute value compared to population
relative_imp = ____ / ____ - ____

# Print relative importance scores rounded to 2 decimals
print(relative_imp.____(____))
Modifier et exécuter le code