ComeçarComece de graça

Identificando conjuntos frequentes com Apriori

O exercício de agregação que você realizou para a loja online foi útil. Ele ofereceu um ponto de partida para entender quais categorias de itens aparecem com frequência nas transações. Agora, a loja quer explorar os próprios itens para descobrir quais são frequentes.

Neste exercício, você vai aplicar o algoritmo Apriori ao conjunto de dados de varejo online sem agregar antes. Seu objetivo será podar os conjuntos de itens usando um valor mínimo de suporte e um limite máximo para o número de itens. Note que pandas já foi importado como pd e os dados em one-hot encoding estão disponíveis como onehot.

Este exercício faz parte do curso

Análise de Cesta de Compras em Python

Ver curso

Instruções do exercício

  • Passe onehot para o algoritmo Apriori.
  • Defina o valor de suporte mínimo como 0.006.
  • Defina o comprimento máximo do conjunto de itens como 3.
  • Imprima uma prévia dos cinco primeiros conjuntos de itens.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import apriori from mlxtend
from mlxtend.frequent_patterns import apriori

# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = apriori(____, 
                            ____ = ____, 
                            max_len = ____, 
                            use_colnames = True)

# Print a preview of the frequent itemsets
print(____.head())
Editar e executar o código