Otimalidade da fronteira suporte-confiança
Você volta para a fundadora com o scatterplot produzido no exercício anterior e pergunta se ela gostaria que você usasse poda para recuperar a fronteira suporte-confiança. Você fala sobre o resultado de Bayardo-Agrawal, mas ela fica cética e pergunta se você pode demonstrar isso em um exemplo.
Lembrando que scatterplots podem escalonar o tamanho dos pontos de acordo com uma terceira métrica, você decide usar isso para demonstrar a otimalidade da fronteira suporte-confiança. Você vai mostrar isso escalonando o tamanho dos pontos usando a métrica lift, que foi uma das métricas às quais Bayardo-Agrawal se aplica. Os dados one-hot encoded já foram importados para você e estão disponíveis como onehot. Além disso, apriori() e association_rules() foram importadas e pandas está disponível como pd.
Este exercício faz parte do curso
Análise de Cesta de Compras em Python
Instruções do exercício
- Aplique o algoritmo Apriori ao DataFrame
onehot. - Calcule as regras de associação usando a métrica
supporte um limite mínimo de 0.0. - Complete a expressão do scatterplot de modo que o tamanho dos pontos seja escalonado por
lift.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import seaborn under its standard alias
import seaborn as sns
# Apply the Apriori algorithm with a support value of 0.0075
frequent_itemsets = ____(____, min_support = 0.0075,
use_colnames = True, max_len = 2)
# Generate association rules without performing additional pruning
rules = ____(frequent_itemsets, metric = "support",
min_threshold = ____)
# Generate scatterplot using support and confidence
sns.scatterplot(x = "support", y = "confidence",
size = "____", data = rules)
plt.show()