LoslegenKostenlos loslegen

Visualisierung des Itemset-Supports

Ein Content-Streaming-Start-up hat dich für Beratungsleistungen angefragt. Um Lizenzgebühren niedrig zu halten, möchte es eine schlanke Filmbibliothek zusammenstellen, die alle dieselbe Zielgruppe anspricht. Zwar bieten sie damit eine kleinere Auswahl als die großen Anbieter der Branche, können dafür aber ein günstiges Abo anbieten.

Du entscheidest dich für das MovieLens-Dataset und eine Heatmap für dieses Projekt. Eine einfache, auf Support basierende Heatmap hilft dir dabei, einzelne Titel zu finden, die hohen Support mit anderen Titeln haben. Die One-Hot-kodierten Daten liegen als DataFrame onehot vor. Außerdem ist pandas als pd verfügbar, seaborn als sns, und apriori() sowie association_rules() wurden bereits importiert.

Diese Übung ist Teil des Kurses

Market Basket Analysis in Python

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Compute frequent itemsets using a minimum support of 0.07
frequent_itemsets = apriori(onehot, min_support = ____, 
                            use_colnames = True, max_len = 2)

# Compute the association rules
rules = association_rules(____, metric = 'support', 
                          min_threshold = 0.0)
Code bearbeiten und ausführen