Auswahl einer Support-Schwelle
Die Managerin des Online-Geschenkeshops schaut sich die Ergebnisse aus der vorherigen Übung an und lobt deine Arbeit. Sie weist jedoch auf ein Problem hin: Alle von dir gefundenen Itemsets enthalten nur einen Artikel. Sie fragt, ob es möglich wäre, eine weniger restriktive Regel zu verwenden und mehr Itemsets zu erzeugen – idealerweise auch solche mit mehreren Artikeln.
Nachdem du dem zustimmst, überlegst du, warum es keine Itemsets mit mehr als einem Artikel gibt. Am max_len-Parameter kann es nicht liegen, denn der war auf drei gesetzt. Du entscheidest, dass es am Support liegen muss, und testest zwei verschiedene Werte, wobei du jeweils prüfst, wie viele zusätzliche Itemsets erzeugt werden. Beachte, dass pandas als pd verfügbar ist und die One-Hot-enkodierten Daten als onehot.
Diese Übung ist Teil des Kurses
Market Basket Analysis in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import apriori from mlxtend
from mlxtend.____ import ____
# Compute frequent itemsets using a support of 0.003 and length of 3
frequent_itemsets_1 = apriori(onehot, min_support = ____,
max_len = ____, use_colnames = True)
# Compute frequent itemsets using a support of 0.001 and length of 3
frequent_itemsets_2 = apriori(onehot, min_support = ____,
____, use_colnames = True)
# Print the number of freqeuent itemsets
print(len(frequent_itemsets_1), len(frequent_itemsets_2))