Segmentación alternativa con NMF
En este ejercicio, vas a analizar datos de compras de productos e identificar segmentos útiles usando el algoritmo de factorización de matrices no negativa (NMF). Funciona bien con matrices cliente por producto dispersas, típicas en comercio electrónico o retail. Por último, extraerás los componentes que explorarás en el siguiente ejercicio.
Hemos cargado pandas como pd y numpy como np. Además, el conjunto de datos original de compras cliente por producto se ha cargado como wholesale.
Este ejercicio forma parte del curso
Machine Learning para marketing en Python
Instrucciones del ejercicio
- Importa la función de factorización de matrices no negativa desde
sklearn.decomposition. - Inicializa una instancia de
NMFcon 4 componentes. - Ajusta el modelo a los datos de ventas
wholesale. - Extrae y guarda los componentes como un DataFrame de
pandas.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import the non-negative matrix factorization module
from sklearn.decomposition import ___
# Initialize NMF instance with 4 components
nmf = ___(4)
# Fit the model on the wholesale sales data
nmf.___(wholesale)
# Extract the components
components = pd.DataFrame(data=nmf.___, columns=wholesale.columns)