Appliquer la règle de Zhang
Au chapitre 2, vous avez appris que la règle de Zhang est une mesure continue d’association entre deux articles, dont les valeurs se situent dans l’intervalle [-1,+1]. Une valeur de -1 indique une association parfaitement négative et une valeur de +1 indique une association parfaitement positive. Dans cet exercice, vous allez déterminer si la règle de Zhang peut servir à affiner un ensemble de règles qu’une boutique de cadeaux utilise actuellement pour promouvoir des produits.
Notez que les itemsets fréquents ont été calculés pour vous et sont disponibles sous frequent_itemsets. De plus, zhangs_rule() a été définie et association_rules() a été importée depuis mlxtend. Vous allez commencer par recalculer l’ensemble initial de règles. Ensuite, vous appliquerez la métrique de Zhang pour ne sélectionner que les règles présentant une association élevée et positive.
Cet exercice fait partie du cours
Analyse des paniers d’achat en Python
Instructions
- Générez l’ensemble des règles d’association avec une valeur de lift d’au moins 1,00.
- Fixez le seuil de support de l’antécédent à 0,005.
- Calculez la règle de Zhang et affectez le résultat à la colonne
zhangderules. - Sélectionnez les règles dont la métrique de Zhang est supérieure à 0,98.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Generate the initial set of rules using a minimum lift of 1.00
rules = association_rules(frequent_itemsets, metric = "____", min_threshold = ____)
# Set antecedent support to 0.005
rules = rules[rules['____'] > 0.005]
# Set consequent support to 0.005
rules = rules[rules['consequent support'] > 0.005]
# Compute Zhang's rule
rules['zhang'] = ____(____)
# Set the lower bound for Zhang's rule to 0.98
rules = rules[____['zhang'] > 0.98]
print(rules[['antecedents', 'consequents']])