Calculer l'importance relative de chaque attribut
Vous allez maintenant calculer l'importance relative des valeurs RFM au sein de chaque cluster.
Nous avons chargé datamart_rfm avec les valeurs RFM brutes, et datamart_rfm_k3 qui contient les valeurs RFM brutes et les étiquettes de cluster stockées dans Cluster. La bibliothèque pandas est également chargée sous le nom pd.
N'hésitez pas à explorer les jeux de données dans la console.
Cet exercice fait partie du cours
Customer Segmentation in Python
Instructions
- Calculez les valeurs RFM moyennes pour chaque cluster : utilisez le jeu de données
datamart_rfm_k3. - Calculez les valeurs RFM moyennes pour l'ensemble de la population de clients : utilisez le jeu de données
datamart_rfm. - Calculez l'importance relative de la valeur de l'attribut du cluster par rapport à la population.
- Affichez les scores d'importance relative arrondis à 2 décimales.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate average RFM values for each cluster
cluster_avg = ____.groupby(['____']).____()
# Calculate average RFM values for the total customer population
population_avg = ____.____()
# Calculate relative importance of cluster's attribute value compared to population
relative_imp = ____ / ____ - ____
# Print relative importance scores rounded to 2 decimals
print(relative_imp.____(____))