Aan de slagGa gratis aan de slag

Prunen met lift

Je brengt opnieuw verslag uit aan de manager van de cadeauwinkel met gadgets. Deze keer vertel je haar dat je geen regels vond met een hogere supportdrempel voor het Apriori-algoritme, en slechts twee regels met een lagere drempel. Ze prijst je goede werk, maar vraagt je om een andere metriek te overwegen om de twee regels terug te brengen naar één.

Je herinnert je dat lift een eenvoudige interpretatie heeft: waarden groter dan 1 geven aan dat items vaker samen voorkomen dan je zou verwachten als ze onafhankelijk over transacties verdeeld waren. Je besluit lift te gebruiken, omdat die boodschap eenvoudig over te brengen is. Let op: pandas is beschikbaar als pd en de one-hot-gecodeerde transactiedata is beschikbaar als onehot. Daarnaast is apriori geïmporteerd uit mlxtend.

Deze oefening maakt deel uit van de cursus

Market Basket Analysis in Python

Cursus bekijken

Oefeninstructies

  • Importeer de functie association_rules uit mlxtend.
  • Bereken de frequente itemsets met een support van 0.001 en een maximale itemset-lengte van 2.
  • Maak de opdracht af zodat alleen regels met een lift van minimaal 1,0 behouden blijven.
  • Print de DataFrame met regels.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import the association rules function
from mlxtend.____ import ____

# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = apriori(onehot, min_support = ____, 
                            max_len = ____, use_colnames = True)

# Compute all association rules for frequent_itemsets
rules = association_rules(frequent_itemsets, 
                            metric = "____", 
                         	min_threshold = ____)

# Print association rules
print(____)
Code bewerken en uitvoeren