Filtrage avancé avec plusieurs métriques

Plus tôt, nous avons utilisé les données d’une boutique en ligne d’objets cadeaux pour trouver des antécédents permettant de promouvoir un conséquent ciblé. Comme l’ensemble de règles potentielles était vaste, nous avons dû nous appuyer sur l’algorithme Apriori et un filtrage multi‑métriques pour le réduire. Dans cet exercice, nous allons examiner l’ensemble complet des règles et en trouver une utile, plutôt que de cibler un antécédent particulier.

Notez que les données ont été chargées, prétraitées et encodées en one‑hot, et sont disponibles sous onehot. De plus, apriori() et association_rules() ont été importées depuis mlxtend. Dans cet exercice, vous appliquerez l’algorithme Apriori pour identifier des itemsets fréquents. Vous récupérerez ensuite l’ensemble des règles d’association à partir de ces itemsets et appliquerez un filtrage multi‑métriques.

Cet exercice fait partie du cours

Analyse des paniers d’achat en Python

Afficher le cours

Instructions

Appliquez l’algorithme Apriori aux itemsets encodés en one‑hot avec un seuil de support minimal de 0,001.
Extrayez les règles d’association en utilisant un seuil de support minimal de 0,001.
Fixez antecedent_support à 0,002 et consequent_support à 0,01.
Imposez une confidence supérieure à 0,60 et un lift supérieur à 2,50.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Apply the Apriori algorithm with a minimum support threshold of 0.001
frequent_itemsets = ____(onehot, min_support = ____, use_colnames = True)

# Recover association rules using a minium support threshold of 0.001
rules = ____(frequent_itemsets, metric = '____', min_threshold = 0.001)

# Apply a 0.002 antecedent support threshold, 0.60 confidence threshold, and 2.50 lift threshold
filtered_rules = rules[(rules['antecedent support'] > ____) &
						(____['consequent support'] > 0.01) &
						(rules['____'] > ____) &
						(____ > 2.50)]

# Print remaining rule
print(filtered_rules[['antecedents','consequents']])

Modifier et exécuter le code

Cet exercice fait partie du cours

Analyse des paniers d’achat en Python

IntermédiaireNiveau de compétence

4.9+

Commencer le cours gratuitement

Dans ce chapitre, vous découvrirez les bases de l’Analyse des paniers d’achat : règles d’association, métriques et élagage. Vous appliquerez ensuite ces concepts pour aider une petite épicerie à améliorer ses actions promotionnelles et l’implantation de ses produits.

Exercise 1: Qu’est-ce que l’analyse de panier ?Exercise 2: Les bases de l'analyse du panier d'achat Exercise 3: Vente croisée de produits Exercise 4: Identifier des règles d’association Exercise 5: Antécédents et conséquents multiples Exercise 6: Préparer les données pour l’analyse des paniers Exercise 7: Générer des règles d’association Exercise 8: La métrique la plus simple Exercise 9: One-hot encoder des données de transaction Exercise 10: Calculer la métrique de support

Les règles d’association indiquent que deux éléments ou plus sont liés. Les métriques nous permettent de quantifier l’intérêt de ces relations. Dans ce chapitre, vous appliquerez six métriques pour évaluer des règles d’association : support, confiance, lift, conviction, levier et la métrique de Zhang. Vous utiliserez ensuite les règles d’association et ces métriques pour aider une bibliothèque et un vendeur d’e-books.

Exercise 1: Confiance et lift Exercise 2: Recommander des livres avec le support Exercise 3: Affiner le support avec la confiance Exercise 4: Affiner l’analyse avec le lift Exercise 5: Leverage et conviction Exercise 6: Lift versus leverage Exercise 7: Calculer la conviction Exercise 8: Calculer la conviction avec une fonction Exercise 9: Promouvoir des ebooks avec la conviction Exercise 10: Association et dissociation Exercise 11: Calculer l’association et la dissociation Exercise 12: Définir la métrique de Zhang Exercise 13: Appliquer la mesure de Zhang Exercise 14: Règles avancées Exercise 15: Filtrer avec le support et la conviction Exercise 16: Utiliser un filtrage multi-métriques pour faire de la promotion croisée de livres

Le défi central de l’Analyse des paniers d’achat consiste à convertir un très grand nombre de décisions clients en un petit ensemble de règles utiles. Ce processus commence généralement par l’algorithme Apriori et s’appuie sur des stratégies complémentaires, comme l’élagage et l’agrégation. Dans ce chapitre, vous apprendrez à utiliser ces méthodes et les appliquerez dans des exercices où vous aiderez un détaillant à choisir l’agencement d’un magasin physique et à mettre en place des ventes croisées de produits.

Exercise 1: Agrégation Exercise 2: Réaliser une agrégation Exercise 3: Définir une fonction d’agrégation Exercise 4: L’algorithme Apriori Exercise 5: Élagage et Apriori Exercise 6: Identifier des itemsets fréquents avec Apriori Exercise 7: Choisir un seuil de support Exercise 8: Pruning de base des résultats d’Apriori Exercise 9: Générer des règles d’association Exercise 10: Élagage avec le lift Exercise 11: Élagage par la confiance Exercise 12: Élagage avancé des résultats d’Apriori Exercise 13: Agrégation et filtrage Exercise 14: Appliquer la règle de Zhang Exercise 15: Filtrage avancé avec plusieurs métriques

Exercice en cours

Dans ce dernier chapitre, vous verrez comment les visualisations guident le processus d’élagage et synthétisent les résultats finaux, qui prennent généralement la forme d’ensembles d’articles ou de règles. Vous maîtriserez les trois visualisations les plus utiles — cartes thermiques, nuages de points et graphiques en coordonnées parallèles — et vous les appliquerez pour aider un service de streaming de films.

Exercise 1: Cartes thermiques Exercise 2: Visualiser le support des itemsets Exercise 3: Cartes thermiques avec lift Exercise 4: Interpréter les cartes thermiques Exercise 5: Nuages de points Exercise 6: Élagage avec des nuages de points Exercise 7: Optimalité de la frontière support–confiance Exercise 8: Diagramme en coordonnées parallèles Exercise 9: Utiliser des coordonnées parallèles pour visualiser des règles Exercise 10: Affiner un diagramme de coordonnées parallèles Exercise 11: Félicitations !