CommencerCommencer gratuitement

Élagage par la confiance

Encore une fois, vous n’avez pas réussi à trancher : vous avez trouvé plusieurs règles utiles, sans parvenir à n’en retenir qu’une. Pire encore, les deux règles identifiées reposent sur le même itemset, avec les antécédents et les conséquents simplement intervertis. Vous décidez donc de vérifier si l’élagage avec une autre métrique pourrait vous permettre de réduire la sélection à une seule règle d’association.

Quelle serait la bonne métrique ? Le lift et le support sont identiques pour toutes les règles générées à partir d’un même itemset ; vous choisissez donc d’utiliser la confiance, qui varie selon les règles issues du même itemset. Notez que pandas est disponible sous l’alias pd et que les transactions encodées en one-hot sont disponibles sous onehot. De plus, apriori a déjà été importé depuis mlxtend.

Cet exercice fait partie du cours

Analyse des paniers d’achat en Python

Afficher le cours

Instructions

  • Importez association_rules depuis mlxtend.
  • Complétez l’appel à l’algorithme apriori avec une valeur de support de 0,0015 et une longueur maximale d’itemset de 2.
  • Complétez l’appel pour les règles d’association en utilisant la confiance comme métrique et un seuil de 0,5.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import the association rules function
____

# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = ____(onehot, ____, 
                            ____, use_colnames = True)

# Compute all association rules using confidence
rules = ____(frequent_itemsets, 
                            metric = "____", 
                         	min_threshold = ____)

# Print association rules
print(rules)
Modifier et exécuter le code