Labels toekennen aan ruwe data
Je gaat nu de gemiddelde RFM-waarden analyseren van de drie clusters die je in de vorige oefening hebt gemaakt. We hebben de ruwe RFM-gegevensset geladen als datamart_rfm, en de clusterlabels als cluster_labels. pandas is beschikbaar als pd.
Voel je vrij om de data in de console te verkennen.
Deze oefening maakt deel uit van de cursus
Klantsegmentatie in Python
Oefeninstructies
- Maak een nieuwe DataFrame door een clusterlabel-kolom toe te voegen aan
datamart_rfm. - Maak een
groupby-element op eenCluster-kolom. - Bereken per
Cluster-waarde de gemiddelde RFM-waarden en de segmentgroottes.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a DataFrame by adding a new cluster label column
datamart_rfm_k3 = datamart_rfm.____(Cluster=cluster_labels)
# Group the data by cluster
grouped = ____.____(['____'])
# Calculate average RFM values and segment sizes per cluster value
grouped.____({
'Recency': '____',
'Frequency': '____',
'MonetaryValue': ['____', '____']
}).round(1)