Labels toekennen aan ruwe data

Je gaat nu de gemiddelde RFM-waarden analyseren van de drie clusters die je in de vorige oefening hebt gemaakt. We hebben de ruwe RFM-gegevensset geladen als datamart_rfm, en de clusterlabels als cluster_labels. pandas is beschikbaar als pd.

Voel je vrij om de data in de console te verkennen.

Deze oefening maakt deel uit van de cursus

Klantsegmentatie in Python

Bekijk cursus

Oefeninstructies

Maak een nieuwe DataFrame door een clusterlabel-kolom toe te voegen aan datamart_rfm.
Maak een groupby-element op een Cluster-kolom.
Bereken per Cluster-waarde de gemiddelde RFM-waarden en de segmentgroottes.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create a DataFrame by adding a new cluster label column
datamart_rfm_k3 = datamart_rfm.____(Cluster=cluster_labels)

# Group the data by cluster
grouped = ____.____(['____'])

# Calculate average RFM values and segment sizes per cluster value
grouped.____({
    'Recency': '____',
    'Frequency': '____',
    'MonetaryValue': ['____', '____']
  }).round(1)

Code bewerken en uitvoeren