Pruning mit Streudiagrammen
Nachdem sie deinen Vorschlag für den Batman-basierten Streamingdienst aus der vorherigen Aufgabe gesehen hat, merkt die Gründerin, dass ihr ursprünglicher Plan vielleicht zu eng gefasst war. Statt sich auf Anfangstitel zu konzentrieren, bittet sie dich, allgemeine Muster in den Assoziationsregeln zu untersuchen und das Pruning entsprechend durchzuführen. Dein Ziel ist es, eine große Menge starker Assoziationen zu identifizieren.
Zum Glück hast du gerade gelernt, wie man Streudiagramme erstellt. Du entscheidest dich, mit Support und Confidence zu beginnen, da sich optimale Regeln gemäß vielen gängigen Metriken am Rand von Confidence und Support befinden. Die one-hot-kodierten Daten wurden für dich importiert und sind als onehot verfügbar. Außerdem wurden apriori() und association_rules() importiert und pandas ist als pd verfügbar.
Diese Übung ist Teil des Kurses
Market Basket Analysis in Python
Anleitung zur Übung
- Erzeuge viele Itemsets mit 2 Items, indem du den minimalen Support auf 0,0075 setzt und die maximale Länge auf 2 festlegst.
- Vervollständige den Aufruf von
association_rules()so, dass keine zusätzliche Filterung erfolgt. - Vervollständige den Aufruf zur Erstellung des Streudiagramms und setze die Variable
yaufconfidence.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import seaborn under its standard alias
import seaborn as sns
# Apply the Apriori algorithm with a support value of 0.0075
frequent_itemsets = apriori(onehot, min_support = ___,
use_colnames = True, max_len = ____)
# Generate association rules without performing additional pruning
rules = association_rules(____, metric = 'support',
min_threshold = ____)
# Generate scatterplot using support and confidence
sns.scatterplot(x = "support", y = "____", data = ____)
plt.show()