Labels den Rohdaten zuweisen
Du analysierst jetzt die durchschnittlichen RFM-Werte der drei Cluster, die du in der vorherigen Übung erstellt hast. Wir haben den Roh-RFM-Datensatz als datamart_rfm geladen und die Cluster-Labels als cluster_labels. pandas steht dir als pd zur Verfügung.
Du kannst die Daten gerne in der Konsole erkunden.
Diese Übung ist Teil des Kurses
Kundensegmentierung in Python
Anleitung zur Übung
- Erstelle einen neuen DataFrame, indem du
datamart_rfmeine Spalte mit den Cluster-Labels hinzufügst. - Erzeuge ein
groupby-Element über die SpalteCluster. - Berechne die durchschnittlichen RFM-Werte und die Segmentgrößen für jeden
Cluster-Wert.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a DataFrame by adding a new cluster label column
datamart_rfm_k3 = datamart_rfm.____(Cluster=cluster_labels)
# Group the data by cluster
grouped = ____.____(['____'])
# Calculate average RFM values and segment sizes per cluster value
grouped.____({
'Recency': '____',
'Frequency': '____',
'MonetaryValue': ['____', '____']
}).round(1)