Poda com lift
Mais uma vez, você faz um relatório para a gerente da loja de presentes criativos. Desta vez, você conta que não identificou nenhuma regra quando usou um limiar de suporte mais alto para o algoritmo Apriori e apenas duas regras quando usou um limiar mais baixo. Ela elogia seu bom trabalho, mas pede que você considere usar outra métrica para reduzir as duas regras para uma.
Você se lembra de que o lift tem uma interpretação simples: valores maiores que 1 indicam que os itens coocorrem mais do que seria esperado se estivessem distribuídos de forma independente entre as transações. Você decide usar o lift, já que essa mensagem será fácil de transmitir. Observe que pandas está disponível como pd e que os dados de transações codificados em one-hot estão disponíveis como onehot. Além disso, apriori já foi importado de mlxtend.
Este exercício faz parte do curso
Análise de Cesta de Compras em Python
Instruções do exercício
- Importe a função
association_rulesdemlxtend. - Calcule os conjuntos frequentes usando suporte de 0.001 e tamanho máximo do conjunto de itens igual a 2.
- Complete a instrução para manter regras com lift de pelo menos 1.0.
- Imprima o DataFrame de regras.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the association rules function
from mlxtend.____ import ____
# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = apriori(onehot, min_support = ____,
max_len = ____, use_colnames = True)
# Compute all association rules for frequent_itemsets
rules = association_rules(frequent_itemsets,
metric = "____",
min_threshold = ____)
# Print association rules
print(____)