Bereken de relatieve belangrijkheid van elk attribuut

Nu ga je de relatieve belangrijkheid berekenen van de RFM-waarden binnen elke cluster.

We hebben datamart_rfm geladen met ruwe RFM-waarden, en datamart_rfm_k3, dat zowel ruwe RFM-waarden bevat als de clusterlabels onder Cluster. De bibliotheek pandas is ook geladen als pd.

Verken de gegevenssets gerust in de console.

Deze oefening maakt deel uit van de cursus

Klantsegmentatie in Python

Bekijk cursus

Oefeninstructies

Bereken de gemiddelde RFM-waarden voor elke cluster — gebruik de gegevensset datamart_rfm_k3.
Bereken de gemiddelde RFM-waarden voor de totale klantenpopulatie — gebruik de gegevensset datamart_rfm.
Bereken de relatieve belangrijkheid van de attribuutwaarde van de cluster ten opzichte van de populatie.
Print de scores voor relatieve belangrijkheid, afgerond op 2 decimalen.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Calculate average RFM values for each cluster
cluster_avg = ____.groupby(['____']).____() 

# Calculate average RFM values for the total customer population
population_avg = ____.____()

# Calculate relative importance of cluster's attribute value compared to population
relative_imp = ____ / ____ - ____

# Print relative importance scores rounded to 2 decimals
print(relative_imp.____(____))

Code bewerken en uitvoeren