Häufige Itemsets mit Apriori identifizieren
Die Aggregationsübung, die du für den Onlinehändler durchgeführt hast, war hilfreich. Sie bot einen Ausgangspunkt, um zu verstehen, welche Kategorien von Artikeln in Transaktionen häufig vorkommen. Der Händler möchte nun die einzelnen Artikel selbst untersuchen, um herauszufinden, welche häufig sind.
In dieser Übung wendest du den Apriori-Algorithmus auf den Online-Retail-Datensatz an, ohne vorher zu aggregieren. Dein Ziel ist es, die Itemsets mithilfe eines minimalen Supportwerts und einer Obergrenze für die Anzahl der Items zu beschneiden (pruning). Beachte, dass pandas als pd importiert wurde und die One-Hot-codierten Daten als onehot verfügbar sind.
Diese Übung ist Teil des Kurses
Market Basket Analysis in Python
Anleitung zur Übung
- Übergib
onehotan den Apriori-Algorithmus. - Setze den minimalen Supportwert auf 0,006.
- Setze die maximale Itemset-Länge auf 3.
- Gib eine Vorschau der ersten fünf Itemsets aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import apriori from mlxtend
from mlxtend.frequent_patterns import apriori
# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = apriori(____,
____ = ____,
max_len = ____,
use_colnames = True)
# Print a preview of the frequent itemsets
print(____.head())