Daten für den Snake Plot vorbereiten

Jetzt bereitest du die Daten für den Snake Plot vor. Du verwendest die RFM-Segmentierung mit 3 Clustern, die du zuvor erstellt hast. Du transformierst die normalisierten RFM-Daten in ein Long-Format, indem du die Metrikspalten in zwei Spalten „schmilzt“ – eine für den Namen der Metrik und eine weitere für den eigentlichen numerischen Wert.

Wir haben die normalisierten RFM-Daten mit bereits zugewiesenen Cluster-Labels geladen. Sie liegen als pandas DataFrame mit dem Namen datamart_normalized vor. Außerdem ist pandas als pd importiert.

Sieh dir datamart_normalized vor Beginn der Übung in der Konsole an, um ein gutes Gefühl für die Struktur zu bekommen!

Diese Übung ist Teil des Kurses

<Kurs>Kundensegmentierung in Python</Kurs>

Kurs ansehen

Übungsanweisungen

Transformiere den Datensatz ins Long-Format, indem du die Funktion melt auf den normalisierten Datensatz mit zurückgesetztem Index anwendest.
Weise CustomerID und Cluster als ID-Variablen zu.
Weise die RFM-Werte als Werte-Variablen zu.
Benenne die Variablen-Spalte als Metric und die Werte-Spalte als Value.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Melt the normalized dataset and reset the index
datamart_melt = pd.____(
  					____.____(), 
                        
# Assign CustomerID and Cluster as ID variables
                    ____=['____', '____'],

# Assign RFM values as value variables
                    ____=['____', '____', '____'], 
                        
# Name the variable and value
                    ____='____', ____='____'
					)

Code bearbeiten und ausführen