ComeçarComece de graça

Otimalidade da fronteira suporte-confiança

Você volta para a fundadora com o scatterplot produzido no exercício anterior e pergunta se ela gostaria que você usasse poda para recuperar a fronteira suporte-confiança. Você fala sobre o resultado de Bayardo-Agrawal, mas ela fica cética e pergunta se você pode demonstrar isso em um exemplo.

Lembrando que scatterplots podem escalonar o tamanho dos pontos de acordo com uma terceira métrica, você decide usar isso para demonstrar a otimalidade da fronteira suporte-confiança. Você vai mostrar isso escalonando o tamanho dos pontos usando a métrica lift, que foi uma das métricas às quais Bayardo-Agrawal se aplica. Os dados one-hot encoded já foram importados para você e estão disponíveis como onehot. Além disso, apriori() e association_rules() foram importadas e pandas está disponível como pd.

Este exercício faz parte do curso

Análise de Cesta de Compras em Python

Ver curso

Instruções do exercício

  • Aplique o algoritmo Apriori ao DataFrame onehot.
  • Calcule as regras de associação usando a métrica support e um limite mínimo de 0.0.
  • Complete a expressão do scatterplot de modo que o tamanho dos pontos seja escalonado por lift.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import seaborn under its standard alias
import seaborn as sns

# Apply the Apriori algorithm with a support value of 0.0075
frequent_itemsets = ____(____, min_support = 0.0075, 
                         use_colnames = True, max_len = 2)

# Generate association rules without performing additional pruning
rules = ____(frequent_itemsets, metric = "support", 
                          min_threshold = ____)

# Generate scatterplot using support and confidence
sns.scatterplot(x = "support", y = "confidence", 
                size = "____", data = rules)
plt.show()
Editar e executar o código