Segmentação alternativa com NMF
Neste exercício, você vai analisar dados de compras de produtos e identificar segmentos relevantes usando o algoritmo de fatoração em matrizes não negativas (NMF). Ele funciona bem com matrizes esparsas de cliente por produto, típicas no varejo e no e-commerce. Por fim, você vai extrair os componentes que serão explorados no próximo exercício.
Carregamos pandas como pd e numpy como np. Além disso, o conjunto de dados bruto de compras de clientes por produto foi carregado como wholesale.
Este exercício faz parte do curso
Machine Learning para Marketing em Python
Instruções do exercício
- Importe a função de fatoração em matrizes não negativas de
sklearn.decomposition. - Inicialize a instância de
NMFcom 4 componentes. - Ajuste o modelo aos dados de vendas de
wholesale. - Extraia e armazene os componentes em um DataFrame do
pandas.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the non-negative matrix factorization module
from sklearn.decomposition import ___
# Initialize NMF instance with 4 components
nmf = ___(4)
# Fit the model on the wholesale sales data
nmf.___(wholesale)
# Extract the components
components = pd.DataFrame(data=nmf.___, columns=wholesale.columns)