Daten für den Snake Plot vorbereiten
Jetzt bereitest du die Daten für den Snake Plot vor. Du verwendest die RFM-Segmentierung mit 3 Clustern, die du zuvor erstellt hast. Du transformierst die normalisierten RFM-Daten in ein Long-Format, indem du die Metrikspalten in zwei Spalten „schmilzt“ – eine für den Namen der Metrik und eine weitere für den eigentlichen numerischen Wert.
Wir haben die normalisierten RFM-Daten mit bereits zugewiesenen Cluster-Labels geladen. Sie liegen als pandas DataFrame mit dem Namen datamart_normalized vor. Außerdem ist pandas als pd importiert.
Sieh dir datamart_normalized vor Beginn der Übung in der Konsole an, um ein gutes Gefühl für die Struktur zu bekommen!
Diese Übung ist Teil des Kurses
Kundensegmentierung in Python
Anleitung zur Übung
- Transformiere den Datensatz ins Long-Format, indem du die Funktion
meltauf den normalisierten Datensatz mit zurückgesetztem Index anwendest. - Weise
CustomerIDundClusterals ID-Variablen zu. - Weise die RFM-Werte als Werte-Variablen zu.
- Benenne die Variablen-Spalte als
Metricund die Werte-Spalte alsValue.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Melt the normalized dataset and reset the index
datamart_melt = pd.____(
____.____(),
# Assign CustomerID and Cluster as ID variables
____=['____', '____'],
# Assign RFM values as value variables
____=['____', '____', '____'],
# Name the variable and value
____='____', ____='____'
)