Identificando conjuntos frequentes com Apriori
O exercício de agregação que você realizou para a loja online foi útil. Ele ofereceu um ponto de partida para entender quais categorias de itens aparecem com frequência nas transações. Agora, a loja quer explorar os próprios itens para descobrir quais são frequentes.
Neste exercício, você vai aplicar o algoritmo Apriori ao conjunto de dados de varejo online sem agregar antes. Seu objetivo será podar os conjuntos de itens usando um valor mínimo de suporte e um limite máximo para o número de itens. Note que pandas já foi importado como pd e os dados em one-hot encoding estão disponíveis como onehot.
Este exercício faz parte do curso
Análise de Cesta de Compras em Python
Instruções do exercício
- Passe
onehotpara o algoritmo Apriori. - Defina o valor de suporte mínimo como 0.006.
- Defina o comprimento máximo do conjunto de itens como 3.
- Imprima uma prévia dos cinco primeiros conjuntos de itens.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import apriori from mlxtend
from mlxtend.frequent_patterns import apriori
# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = apriori(____,
____ = ____,
max_len = ____,
use_colnames = True)
# Print a preview of the frequent itemsets
print(____.head())