Alternatieve segmentatie met NMF
In deze oefening analyseer je productaankoopdata en identificeer je betekenisvolle segmenten met behulp van het non-negative matrix factorization-algoritme (NMF). Dit werkt goed met sparse klant-voor-productmatrices die typisch zijn in e-commerce of retail. Tot slot extraheer je de componenten die je in de volgende oefening verder gaat verkennen.
We hebben pandas als pd en numpy als np geladen. Ook is de ruwe klant-voor-product-aankoopsgegevensset geladen als wholesale.
Deze oefening maakt deel uit van de cursus
Machine Learning voor marketing in Python
Oefeninstructies
- Importeer de non-negative matrix factorization-functie uit
sklearn.decomposition. - Initialiseer een
NMF-instantie met 4 componenten. - Fit het model op de
wholesale-verkoopdata. - Extraheer en sla de componenten op als een
pandasDataFrame.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the non-negative matrix factorization module
from sklearn.decomposition import ___
# Initialize NMF instance with 4 components
nmf = ___(4)
# Fit the model on the wholesale sales data
nmf.___(wholesale)
# Extract the components
components = pd.DataFrame(data=nmf.___, columns=wholesale.columns)