Bereken de relatieve belangrijkheid van elk attribuut
Nu ga je de relatieve belangrijkheid berekenen van de RFM-waarden binnen elke cluster.
We hebben datamart_rfm geladen met ruwe RFM-waarden, en datamart_rfm_k3, dat zowel ruwe RFM-waarden bevat als de clusterlabels onder Cluster. De bibliotheek pandas is ook geladen als pd.
Verken de gegevenssets gerust in de console.
Deze oefening maakt deel uit van de cursus
Klantsegmentatie in Python
Oefeninstructies
- Bereken de gemiddelde RFM-waarden voor elke cluster — gebruik de gegevensset
datamart_rfm_k3. - Bereken de gemiddelde RFM-waarden voor de totale klantenpopulatie — gebruik de gegevensset
datamart_rfm. - Bereken de relatieve belangrijkheid van de attribuutwaarde van de cluster ten opzichte van de populatie.
- Print de scores voor relatieve belangrijkheid, afgerond op 2 decimalen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Calculate average RFM values for each cluster
cluster_avg = ____.groupby(['____']).____()
# Calculate average RFM values for the total customer population
population_avg = ____.____()
# Calculate relative importance of cluster's attribute value compared to population
relative_imp = ____ / ____ - ____
# Print relative importance scores rounded to 2 decimals
print(relative_imp.____(____))