NMF-segmentatiegemiddelden

Tot slot ga je de gemiddelde waarden van de 3-segmentoplossing die met NMF is gebouwd visueel verkennen en kun je die vergelijken met de K-means-oplossing. Hier haal je de featurematrix W op, die we gebruiken om de harde segmenttoewijzing te bepalen door voor elke klant de kolomwaarde (segment) met de hoogste bijbehorende waarde in deze matrix te kiezen.

We hebben de bibliotheek pandas als pd en seaborn als sns geladen. De ruwe wholesale-gegevensset is geïmporteerd, en de al getrainde 3-segment-NMF-instantie als nmf. De components-gegevensset is geladen als pandas DataFrame.

Deze oefening maakt deel uit van de cursus

Machine Learning voor marketing in Python

Bekijk cursus

Oefeninstructies

Maak de W-matrix door de getransformeerde waarden als data door te geven en de componentenindex als kolomnamen.
Ken het segment toe door de kolomnaam te selecteren waarvoor de overeenkomstige waarde het grootst is.
Bereken de gemiddelde kolomwaarden per segment.
Plot de gemiddelde waarden als een heatmap.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create the W matrix
W = pd.DataFrame(data=nmf.___(wholesale), columns=components.index)
W.index = wholesale.index

# Assign the column name where the corresponding value is the largest
wholesale_nmf3 = wholesale.___(segment = W.idxmax(axis=1))

# Calculate the average column values per each segment
nmf3_averages = wholesale_nmf3.___('___').mean().round(0)

# Plot the average values as heatmap
sns.___(___.T, cmap='YlGnBu')

# Display the chart
plt.show()

Code bewerken en uitvoeren