Segmentation alternative avec NMF
Dans cet exercice, vous allez analyser des données d’achats de produits et identifier des segments pertinents à l’aide de l’algorithme de factorisation de matrices non négatives (NMF). Il fonctionne bien avec les matrices clairsemées client × produit, typiques du e-commerce ou du retail. Enfin, vous extraierez les composantes que vous explorerez dans l’exercice suivant.
Nous avons importé pandas sous l’alias pd et numpy sous l’alias np. De plus, le jeu de données brut des achats client × produit a été chargé sous le nom wholesale.
Cet exercice fait partie du cours
Machine Learning pour le marketing en Python
Instructions
- Importez la fonction de factorisation de matrices non négatives depuis
sklearn.decomposition. - Initialisez une instance de
NMFavec 4 composantes. - Ajustez le modèle sur les données de ventes
wholesale. - Extrayez et stockez les composantes dans un DataFrame
pandas.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the non-negative matrix factorization module
from sklearn.decomposition import ___
# Initialize NMF instance with 4 components
nmf = ___(4)
# Fit the model on the wholesale sales data
nmf.___(wholesale)
# Extract the components
components = pd.DataFrame(data=nmf.___, columns=wholesale.columns)