Data voorbereiden voor de snake-plot

Nu ga je data voorbereiden voor de snake-plot. Je gebruikt de RFM-segmentatieoplossing met 3 clusters die je eerder hebt gemaakt. Je zet de genormaliseerde RFM-data om naar een lang formaat door de metriek-kolommen te “smelten” naar twee kolommen: één met de naam van de metriek en één met de daadwerkelijke numerieke waarde.

We hebben de genormaliseerde RFM-data alvast geladen met de toegewezen clusterlabels. Deze staat als een pandas DataFrame met de naam datamart_normalized. Ook is pandas geïmporteerd als pd.

Verken datamart_normalized eerst in de console voordat je met de oefening begint, zodat je een goed beeld krijgt van de structuur!

Deze oefening maakt deel uit van de cursus

Klantsegmentatie in Python

Bekijk cursus

Oefeninstructies

Zet de gegevensset om naar lang formaat door de functie melt toe te passen op de genormaliseerde gegevensset met een geresette index.
Stel CustomerID en Cluster in als ID-variabelen.
Stel de RFM-waarden in als waardevariabelen.
Noem de variabele Metric en de waarde Value.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Melt the normalized dataset and reset the index
datamart_melt = pd.____(
  					____.____(), 
                        
# Assign CustomerID and Cluster as ID variables
                    ____=['____', '____'],

# Assign RFM values as value variables
                    ____=['____', '____', '____'], 
                        
# Name the variable and value
                    ____='____', ____='____'
					)

Code bewerken en uitvoeren