CommencerCommencer gratuitement

Élagage avec le lift

Encore une fois, vous faites votre rapport à la responsable de la boutique de cadeaux originaux. Cette fois, vous lui indiquez que vous n’avez trouvé aucune règle avec un seuil de support plus élevé pour l’algorithme Apriori et seulement deux règles avec un seuil plus bas. Elle vous félicite pour votre bon travail, mais vous demande d’envisager l’utilisation d’une autre métrique pour réduire ces deux règles à une seule.

Vous vous souvenez que le lift a une interprétation simple : des valeurs supérieures à 1 indiquent que les articles coapparaissent plus souvent qu’attendu s’ils étaient distribués indépendamment entre les transactions. Vous décidez donc d’utiliser le lift, car le message sera facile à faire passer. Notez que pandas est disponible sous pd et que les transactions encodées en one-hot sont disponibles sous onehot. De plus, apriori a été importé depuis mlxtend.

Cet exercice fait partie du cours

Analyse des paniers d’achat en Python

Afficher le cours

Instructions

  • Importez la fonction association_rules depuis mlxtend.
  • Calculez les itemsets fréquents avec un support de 0,001 et une taille maximale d’itemset de 2.
  • Complétez l’instruction pour conserver les règles avec un lift d’au moins 1,0.
  • Affichez le DataFrame des règles.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import the association rules function
from mlxtend.____ import ____

# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = apriori(onehot, min_support = ____, 
                            max_len = ____, use_colnames = True)

# Compute all association rules for frequent_itemsets
rules = association_rules(frequent_itemsets, 
                            metric = "____", 
                         	min_threshold = ____)

# Print association rules
print(____)
Modifier et exécuter le code