Optimalité de la frontière support–confiance

Vous retournez voir la fondatrice avec le nuage de points produit dans l’exercice précédent et lui demandez si elle souhaite que vous utilisiez l’élagage pour retrouver la frontière support–confiance. Vous lui parlez du résultat de Bayardo-Agrawal, mais elle reste sceptique et vous demande si vous pouvez le démontrer sur un exemple.

En vous rappelant que les nuages de points peuvent dimensionner la taille des points selon une troisième métrique, vous décidez d’utiliser cela pour démontrer l’optimalité de la frontière support–confiance. Vous le montrerez en faisant varier la taille des points avec la métrique lift, l’une de celles auxquelles le résultat de Bayardo-Agrawal s’applique. Les données encodées en one-hot ont été importées pour vous et sont disponibles sous onehot. De plus, apriori() et association_rules() ont été importées et pandas est disponible sous pd.

Cet exercice fait partie du cours

Analyse des paniers d’achat en Python

Afficher le cours

Instructions

Appliquez l’algorithme Apriori au DataFrame onehot.
Calculez les règles d’association en utilisant la métrique support et un seuil minimal de 0.0.
Complétez l’expression du nuage de points afin que la taille des points soit ajustée par lift.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import seaborn under its standard alias
import seaborn as sns

# Apply the Apriori algorithm with a support value of 0.0075
frequent_itemsets = ____(____, min_support = 0.0075, 
                         use_colnames = True, max_len = 2)

# Generate association rules without performing additional pruning
rules = ____(frequent_itemsets, metric = "support", 
                          min_threshold = ____)

# Generate scatterplot using support and confidence
sns.scatterplot(x = "support", y = "confidence", 
                size = "____", data = rules)
plt.show()

Modifier et exécuter le code

Cet exercice fait partie du cours

Analyse des paniers d’achat en Python

IntermédiaireNiveau de compétence

4.9+

Commencer le cours gratuitement

Dans ce chapitre, vous découvrirez les bases de l’Analyse des paniers d’achat : règles d’association, métriques et élagage. Vous appliquerez ensuite ces concepts pour aider une petite épicerie à améliorer ses actions promotionnelles et l’implantation de ses produits.

Exercise 1: Qu’est-ce que l’analyse de panier ?Exercise 2: Les bases de l'analyse du panier d'achat Exercise 3: Vente croisée de produits Exercise 4: Identifier des règles d’association Exercise 5: Antécédents et conséquents multiples Exercise 6: Préparer les données pour l’analyse des paniers Exercise 7: Générer des règles d’association Exercise 8: La métrique la plus simple Exercise 9: One-hot encoder des données de transaction Exercise 10: Calculer la métrique de support

Les règles d’association indiquent que deux éléments ou plus sont liés. Les métriques nous permettent de quantifier l’intérêt de ces relations. Dans ce chapitre, vous appliquerez six métriques pour évaluer des règles d’association : support, confiance, lift, conviction, levier et la métrique de Zhang. Vous utiliserez ensuite les règles d’association et ces métriques pour aider une bibliothèque et un vendeur d’e-books.

Exercise 1: Confiance et lift Exercise 2: Recommander des livres avec le support Exercise 3: Affiner le support avec la confiance Exercise 4: Affiner l’analyse avec le lift Exercise 5: Leverage et conviction Exercise 6: Lift versus leverage Exercise 7: Calculer la conviction Exercise 8: Calculer la conviction avec une fonction Exercise 9: Promouvoir des ebooks avec la conviction Exercise 10: Association et dissociation Exercise 11: Calculer l’association et la dissociation Exercise 12: Définir la métrique de Zhang Exercise 13: Appliquer la mesure de Zhang Exercise 14: Règles avancées Exercise 15: Filtrer avec le support et la conviction Exercise 16: Utiliser un filtrage multi-métriques pour faire de la promotion croisée de livres

Le défi central de l’Analyse des paniers d’achat consiste à convertir un très grand nombre de décisions clients en un petit ensemble de règles utiles. Ce processus commence généralement par l’algorithme Apriori et s’appuie sur des stratégies complémentaires, comme l’élagage et l’agrégation. Dans ce chapitre, vous apprendrez à utiliser ces méthodes et les appliquerez dans des exercices où vous aiderez un détaillant à choisir l’agencement d’un magasin physique et à mettre en place des ventes croisées de produits.

Exercise 1: Agrégation Exercise 2: Réaliser une agrégation Exercise 3: Définir une fonction d’agrégation Exercise 4: L’algorithme Apriori Exercise 5: Élagage et Apriori Exercise 6: Identifier des itemsets fréquents avec Apriori Exercise 7: Choisir un seuil de support Exercise 8: Pruning de base des résultats d’Apriori Exercise 9: Générer des règles d’association Exercise 10: Élagage avec le lift Exercise 11: Élagage par la confiance Exercise 12: Élagage avancé des résultats d’Apriori Exercise 13: Agrégation et filtrage Exercise 14: Appliquer la règle de Zhang Exercise 15: Filtrage avancé avec plusieurs métriques

Dans ce dernier chapitre, vous verrez comment les visualisations guident le processus d’élagage et synthétisent les résultats finaux, qui prennent généralement la forme d’ensembles d’articles ou de règles. Vous maîtriserez les trois visualisations les plus utiles — cartes thermiques, nuages de points et graphiques en coordonnées parallèles — et vous les appliquerez pour aider un service de streaming de films.

Exercise 1: Cartes thermiques Exercise 2: Visualiser le support des itemsets Exercise 3: Cartes thermiques avec lift Exercise 4: Interpréter les cartes thermiques Exercise 5: Nuages de points Exercise 6: Élagage avec des nuages de points Exercise 7: Optimalité de la frontière support–confiance

Exercice en cours

Exercise 8: Diagramme en coordonnées parallèles Exercise 9: Utiliser des coordonnées parallèles pour visualiser des règles Exercise 10: Affiner un diagramme de coordonnées parallèles Exercise 11: Félicitations !