Aan de slagGa gratis aan de slag

Een supportdrempel selecteren

De manager van de online cadeauwinkel bekijkt de resultaten die je in de vorige oefening hebt opgeleverd en complimenteert je met het goede werk. Ze heeft echter een punt: alle itemsets die je hebt gevonden bevatten maar één item. Ze vraagt of het mogelijk is om een minder strikte regel te gebruiken en meer itemsets te genereren, bij voorkeur ook met meerdere items.

Als je hiermee instemt, denk je na over wat het gebrek aan itemsets met meer dan 1 item kan verklaren. Het kan niet aan de parameter max_len liggen, want die stond op drie. Je besluit dat het aan de support moet liggen en gaat twee verschillende waarden testen, waarbij je telkens bekijkt hoeveel extra itemsets er worden gegenereerd. Let op: pandas is beschikbaar als pd en de one-hot-gecodeerde data als onehot.

Deze oefening maakt deel uit van de cursus

Market Basket Analysis in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import apriori from mlxtend
from mlxtend.____ import ____

# Compute frequent itemsets using a support of 0.003 and length of 3
frequent_itemsets_1 = apriori(onehot, min_support = ____, 
                            max_len = ____, use_colnames = True)

# Compute frequent itemsets using a support of 0.001 and length of 3
frequent_itemsets_2 = apriori(onehot, min_support = ____, 
                            ____, use_colnames = True)

# Print the number of freqeuent itemsets
print(len(frequent_itemsets_1), len(frequent_itemsets_2))
Code bewerken en uitvoeren