Visualizando o suporte de itemsets
Uma startup de streaming de conteúdo procurou você para consultoria. Para manter as taxas de licenciamento baixas, eles querem montar um catálogo enxuto de filmes que agradem ao mesmo público. Embora ofereçam uma seleção menor de conteúdo do que os grandes players do setor, também poderão cobrar uma assinatura mais baixa.
Você decide usar os dados do MovieLens e um mapa de calor para este projeto. Usar um mapa de calor simples baseado em suporte permitirá identificar títulos individuais que têm alto suporte com outros títulos. Os dados one-hot codificados estão disponíveis no DataFrame onehot. Além disso, pandas está disponível como pd, seaborn como sns, e apriori() e association_rules() já foram importadas.
Este exercício faz parte do curso
Análise de Cesta de Compras em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Compute frequent itemsets using a minimum support of 0.07
frequent_itemsets = apriori(onehot, min_support = ____,
use_colnames = True, max_len = 2)
# Compute the association rules
rules = association_rules(____, metric = 'support',
min_threshold = 0.0)