Aan de slagBegin gratis

Itemset-support visualiseren

Een content-streamingstart-up heeft je benaderd voor advies. Om licentiekosten laag te houden, willen ze een compacte catalogus samenstellen met films die allemaal dezelfde doelgroep aanspreken. Hun aanbod is kleiner dan dat van de grote spelers, maar ze kunnen wel een lage abonnementsprijs bieden.

Je besluit voor dit project de MovieLens-gegevens en een heatmap te gebruiken. Met een simpele, op support gebaseerde heatmap kun je titels vinden die vaak samen met andere titels voorkomen. De one-hot-encoded gegevens staan in de DataFrame onehot. Daarnaast is pandas beschikbaar als pd, seaborn als sns, en zijn apriori() en association_rules() al geïmporteerd.

Deze oefening maakt deel uit van de cursus

Market Basket Analysis in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Compute frequent itemsets using a minimum support of 0.07
frequent_itemsets = apriori(onehot, min_support = ____, 
                            use_colnames = True, max_len = 2)

# Compute the association rules
rules = association_rules(____, metric = 'support', 
                          min_threshold = 0.0)
Code bewerken en uitvoeren