Identifier des itemsets fréquents avec Apriori

L’exercice d’agrégation que vous avez réalisé pour le commerçant en ligne a été utile. Il a permis de commencer à comprendre quelles catégories d’articles apparaissent souvent dans les transactions. Le commerçant souhaite maintenant étudier les articles individuels eux‑mêmes pour identifier ceux qui sont fréquents.

Dans cet exercice, vous allez appliquer l’algorithme Apriori au jeu de données du commerce en ligne sans procéder d’abord à une agrégation. Votre objectif sera d’élaguer les itemsets en imposant une valeur minimale de support et un seuil maximal sur le nombre d’articles. Notez que pandas a été importé sous l’alias pd et que les données encodées en one-hot sont disponibles dans onehot.

Cet exercice fait partie du cours

<cours>Analyse des paniers d’achat en Python</cours>

Instructions de l’exercice

Passez onehot à l’algorithme Apriori.
Définissez la valeur minimale de support à 0,006.
Fixez la taille maximale des itemsets à 3.
Affichez un aperçu des cinq premiers itemsets.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import apriori from mlxtend
from mlxtend.frequent_patterns import apriori

# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = apriori(____, 
                            ____ = ____, 
                            max_len = ____, 
                            use_colnames = True)

# Print a preview of the frequent itemsets
print(____.head())

Modifier et exécuter le code

Cet exercice fait partie du cours

<cours>Analyse des paniers d’achat en Python</cours>

IntermédiaireNiveau de compétence

4.9+

Commencer le cours gratuitement

Dans ce chapitre, vous découvrirez les bases de l’Analyse des paniers d’achat : règles d’association, métriques et élagage. Vous appliquerez ensuite ces concepts pour aider une petite épicerie à améliorer ses actions promotionnelles et l’implantation de ses produits.

Exercise 1: Qu’est-ce que l’analyse de panier ?Exercise 2: Les bases de l'analyse du panier d'achat Exercise 3: Vente croisée de produits Exercise 4: Identifier des règles d’association Exercise 5: Antécédents et conséquents multiples Exercise 6: Préparer les données pour l’analyse des paniers Exercise 7: Générer des règles d’association Exercise 8: La métrique la plus simple Exercise 9: One-hot encoder des données de transaction Exercise 10: Calculer la métrique de support

Les règles d’association indiquent que deux éléments ou plus sont liés. Les métriques nous permettent de quantifier l’intérêt de ces relations. Dans ce chapitre, vous appliquerez six métriques pour évaluer des règles d’association : support, confiance, lift, conviction, levier et la métrique de Zhang. Vous utiliserez ensuite les règles d’association et ces métriques pour aider une bibliothèque et un vendeur d’e-books.

Exercise 1: Confiance et lift Exercise 2: Recommander des livres avec le support Exercise 3: Affiner le support avec la confiance Exercise 4: Affiner l’analyse avec le lift Exercise 5: Leverage et conviction Exercise 6: Lift versus leverage Exercise 7: Calculer la conviction Exercise 8: Calculer la conviction avec une fonction Exercise 9: Promouvoir des ebooks avec la conviction Exercise 10: Association et dissociation Exercise 11: Calculer l’association et la dissociation Exercise 12: Définir la métrique de Zhang Exercise 13: Appliquer la mesure de Zhang Exercise 14: Règles avancées Exercise 15: Filtrer avec le support et la conviction Exercise 16: Utiliser un filtrage multi-métriques pour faire de la promotion croisée de livres

Le défi central de l’Analyse des paniers d’achat consiste à convertir un très grand nombre de décisions clients en un petit ensemble de règles utiles. Ce processus commence généralement par l’algorithme Apriori et s’appuie sur des stratégies complémentaires, comme l’élagage et l’agrégation. Dans ce chapitre, vous apprendrez à utiliser ces méthodes et les appliquerez dans des exercices où vous aiderez un détaillant à choisir l’agencement d’un magasin physique et à mettre en place des ventes croisées de produits.

Exercise 1: Agrégation Exercise 2: Réaliser une agrégation Exercise 3: Définir une fonction d’agrégation Exercise 4: L’algorithme Apriori Exercise 5: Élagage et Apriori Exercise 6: Identifier des itemsets fréquents avec Apriori

Exercice actuel

Exercise 7: Choisir un seuil de support Exercise 8: Pruning de base des résultats d’Apriori Exercise 9: Générer des règles d’association Exercise 10: Élagage avec le lift Exercise 11: Élagage par la confiance Exercise 12: Élagage avancé des résultats d’Apriori Exercise 13: Agrégation et filtrage Exercise 14: Appliquer la règle de Zhang Exercise 15: Filtrage avancé avec plusieurs métriques

Dans ce dernier chapitre, vous verrez comment les visualisations guident le processus d’élagage et synthétisent les résultats finaux, qui prennent généralement la forme d’ensembles d’articles ou de règles. Vous maîtriserez les trois visualisations les plus utiles — cartes thermiques, nuages de points et graphiques en coordonnées parallèles — et vous les appliquerez pour aider un service de streaming de films.

Exercise 1: Cartes thermiques Exercise 2: Visualiser le support des itemsets Exercise 3: Cartes thermiques avec lift Exercise 4: Interpréter les cartes thermiques Exercise 5: Nuages de points Exercise 6: Élagage avec des nuages de points Exercise 7: Optimalité de la frontière support–confiance Exercise 8: Diagramme en coordonnées parallèles Exercise 9: Utiliser des coordonnées parallèles pour visualiser des règles Exercise 10: Affiner un diagramme de coordonnées parallèles Exercise 11: Félicitations !