Data voorbereiden voor de snake-plot
Nu ga je data voorbereiden voor de snake-plot. Je gebruikt de RFM-segmentatieoplossing met 3 clusters die je eerder hebt gemaakt. Je zet de genormaliseerde RFM-data om naar een lang formaat door de metriek-kolommen te “smelten” naar twee kolommen: één met de naam van de metriek en één met de daadwerkelijke numerieke waarde.
We hebben de genormaliseerde RFM-data alvast geladen met de toegewezen clusterlabels. Deze staat als een pandas DataFrame met de naam datamart_normalized. Ook is pandas geïmporteerd als pd.
Verken datamart_normalized eerst in de console voordat je met de oefening begint, zodat je een goed beeld krijgt van de structuur!
Deze oefening maakt deel uit van de cursus
Klantsegmentatie in Python
Oefeninstructies
- Zet de gegevensset om naar lang formaat door de functie
melttoe te passen op de genormaliseerde gegevensset met een geresette index. - Stel
CustomerIDenClusterin als ID-variabelen. - Stel de RFM-waarden in als waardevariabelen.
- Noem de variabele
Metricen de waardeValue.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Melt the normalized dataset and reset the index
datamart_melt = pd.____(
____.____(),
# Assign CustomerID and Cluster as ID variables
____=['____', '____'],
# Assign RFM values as value variables
____=['____', '____', '____'],
# Name the variable and value
____='____', ____='____'
)