Visualiser le support des itemsets
Une jeune plateforme de streaming vous sollicite pour une mission de conseil. Pour maintenir de faibles coûts de licence, elle souhaite constituer un catalogue restreint de films qui plaisent tous au même public. Elle proposera donc une sélection plus limitée que les grands acteurs du secteur, mais avec un abonnement peu coûteux.
Vous décidez d’utiliser les données MovieLens et une carte thermique pour ce projet. Une heatmap basée simplement sur le support vous permettra d’identifier les titres qui présentent un fort support avec d’autres titres. Les données encodées en one-hot sont disponibles dans le DataFrame onehot. Par ailleurs, pandas est disponible sous pd, seaborn sous sns, et apriori() ainsi que association_rules() ont déjà été importées.
Cet exercice fait partie du cours
Analyse des paniers d’achat en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute frequent itemsets using a minimum support of 0.07
frequent_itemsets = apriori(onehot, min_support = ____,
use_colnames = True, max_len = 2)
# Compute the association rules
rules = association_rules(____, metric = 'support',
min_threshold = 0.0)