Segmentazione alternativa con NMF
In questo esercizio analizzerai i dati di acquisto dei prodotti e individuerai segmenti significativi usando l'algoritmo di Non-negative Matrix Factorization (NMF). Funziona bene con matrici cliente-per-prodotto sparse, tipiche dell'e-commerce o del retail. Infine, estrarrai i componenti che poi esplorerai nel prossimo esercizio.
Abbiamo caricato pandas come pd e numpy come np. Inoltre, il dataset grezzo degli acquisti cliente-per-prodotto è stato caricato come wholesale.
Questo esercizio fa parte del corso
Machine Learning per il marketing con Python
Istruzioni dell'esercizio
- Importa la funzione di Non-negative Matrix Factorization da
sklearn.decomposition. - Inizializza un'istanza di
NMFcon 4 componenti. - Esegui il fit del modello sui dati di vendita
wholesale. - Estrai e salva i componenti come un DataFrame di
pandas.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the non-negative matrix factorization module
from sklearn.decomposition import ___
# Initialize NMF instance with 4 components
nmf = ___(4)
# Fit the model on the wholesale sales data
nmf.___(wholesale)
# Extract the components
components = pd.DataFrame(data=nmf.___, columns=wholesale.columns)