CommencerCommencer gratuitement

Identifier des itemsets fréquents avec Apriori

L’exercice d’agrégation que vous avez réalisé pour le commerçant en ligne a été utile. Il a permis de commencer à comprendre quelles catégories d’articles apparaissent souvent dans les transactions. Le commerçant souhaite maintenant étudier les articles individuels eux‑mêmes pour identifier ceux qui sont fréquents.

Dans cet exercice, vous allez appliquer l’algorithme Apriori au jeu de données du commerce en ligne sans procéder d’abord à une agrégation. Votre objectif sera d’élaguer les itemsets en imposant une valeur minimale de support et un seuil maximal sur le nombre d’articles. Notez que pandas a été importé sous l’alias pd et que les données encodées en one-hot sont disponibles dans onehot.

Cet exercice fait partie du cours

Analyse des paniers d’achat en Python

Afficher le cours

Instructions

  • Passez onehot à l’algorithme Apriori.
  • Définissez la valeur minimale de support à 0,006.
  • Fixez la taille maximale des itemsets à 3.
  • Affichez un aperçu des cinq premiers itemsets.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import apriori from mlxtend
from mlxtend.frequent_patterns import apriori

# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = apriori(____, 
                            ____ = ____, 
                            max_len = ____, 
                            use_colnames = True)

# Print a preview of the frequent itemsets
print(____.head())
Modifier et exécuter le code