Identifier des itemsets fréquents avec Apriori
L’exercice d’agrégation que vous avez réalisé pour le commerçant en ligne a été utile. Il a permis de commencer à comprendre quelles catégories d’articles apparaissent souvent dans les transactions. Le commerçant souhaite maintenant étudier les articles individuels eux‑mêmes pour identifier ceux qui sont fréquents.
Dans cet exercice, vous allez appliquer l’algorithme Apriori au jeu de données du commerce en ligne sans procéder d’abord à une agrégation. Votre objectif sera d’élaguer les itemsets en imposant une valeur minimale de support et un seuil maximal sur le nombre d’articles. Notez que pandas a été importé sous l’alias pd et que les données encodées en one-hot sont disponibles dans onehot.
Cet exercice fait partie du cours
Analyse des paniers d’achat en Python
Instructions
- Passez
onehotà l’algorithme Apriori. - Définissez la valeur minimale de support à 0,006.
- Fixez la taille maximale des itemsets à 3.
- Affichez un aperçu des cinq premiers itemsets.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import apriori from mlxtend
from mlxtend.frequent_patterns import apriori
# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = apriori(____,
____ = ____,
max_len = ____,
use_colnames = True)
# Print a preview of the frequent itemsets
print(____.head())