Aan de slagGa gratis aan de slag

Itemset-support visualiseren

Een content-streamingstart-up heeft je benaderd voor advies. Om licentiekosten laag te houden, willen ze een compacte catalogus samenstellen met films die allemaal dezelfde doelgroep aanspreken. Hun aanbod is kleiner dan dat van de grote spelers, maar ze kunnen wel een lage abonnementsprijs bieden.

Je besluit voor dit project de MovieLens-gegevens en een heatmap te gebruiken. Met een simpele, op support gebaseerde heatmap kun je titels vinden die vaak samen met andere titels voorkomen. De one-hot-encoded gegevens staan in de DataFrame onehot. Daarnaast is pandas beschikbaar als pd, seaborn als sns, en zijn apriori() en association_rules() al geïmporteerd.

Deze oefening maakt deel uit van de cursus

Market Basket Analysis in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Compute frequent itemsets using a minimum support of 0.07
frequent_itemsets = apriori(onehot, min_support = ____, 
                            use_colnames = True, max_len = 2)

# Compute the association rules
rules = association_rules(____, metric = 'support', 
                          min_threshold = 0.0)
Code bewerken en uitvoeren