CommencerCommencer gratuitement

Visualiser le support des itemsets

Une jeune plateforme de streaming vous sollicite pour une mission de conseil. Pour maintenir de faibles coûts de licence, elle souhaite constituer un catalogue restreint de films qui plaisent tous au même public. Elle proposera donc une sélection plus limitée que les grands acteurs du secteur, mais avec un abonnement peu coûteux.

Vous décidez d’utiliser les données MovieLens et une carte thermique pour ce projet. Une heatmap basée simplement sur le support vous permettra d’identifier les titres qui présentent un fort support avec d’autres titres. Les données encodées en one-hot sont disponibles dans le DataFrame onehot. Par ailleurs, pandas est disponible sous pd, seaborn sous sns, et apriori() ainsi que association_rules() ont déjà été importées.

Cet exercice fait partie du cours

Analyse des paniers d’achat en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute frequent itemsets using a minimum support of 0.07
frequent_itemsets = apriori(onehot, min_support = ____, 
                            use_colnames = True, max_len = 2)

# Compute the association rules
rules = association_rules(____, metric = 'support', 
                          min_threshold = 0.0)
Modifier et exécuter le code