Poda por confiança
Mais uma vez, você ficou indeciso: encontrou várias regras úteis, mas não consegue chegar a uma só. Pior ainda, as duas regras que você achou usam o mesmo conjunto de itens, apenas trocando antecedentes e consequentes. Você decide verificar se podar por outra métrica pode ajudar a reduzir tudo a uma única regra de associação.
Qual seria a métrica certa? Tanto o lift quanto o suporte são idênticos para todas as regras geradas a partir de um mesmo conjunto de itens, então você decide usar a confiança, que varia entre regras produzidas do mesmo conjunto. Observe que pandas está disponível como pd e que os dados de transações one-hot estão disponíveis como onehot. Além disso, apriori já foi importado de mlxtend.
Este exercício faz parte do curso
Análise de Cesta de Compras em Python
Instruções do exercício
- Importe
association_rulesdemlxtend. - Complete a chamada do algoritmo
aprioriusando valor de suporte 0.0015 e comprimento máximo do conjunto de itens igual a 2. - Complete a chamada para as regras de associação usando confiança como métrica e valor de limiar de 0.5.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the association rules function
____
# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = ____(onehot, ____,
____, use_colnames = True)
# Compute all association rules using confidence
rules = ____(frequent_itemsets,
metric = "____",
min_threshold = ____)
# Print association rules
print(rules)