Optimalität der Support-Confidence-Grenze

Du legst der Gründerin das Streudiagramm aus der vorherigen Übung vor und fragst, ob du mithilfe von Pruning die Support-Confidence-Grenze rekonstruieren sollst. Du erwähnst das Bayardo-Agrawal-Ergebnis, aber sie ist skeptisch und bittet dich, das an einem Beispiel zu zeigen.

Da Streudiagramme die Punktgröße nach einer dritten Kennzahl skalieren können, entscheidest du dich, damit die Optimalität der Support-Confidence-Grenze zu veranschaulichen. Du zeigst dies, indem du die Punktgröße mit der Kennzahl lift skalierst, einer der Kennzahlen, auf die sich Bayardo-Agrawal bezieht. Die One-Hot-kodierten Daten wurden bereits importiert und stehen als onehot bereit. Außerdem wurden apriori() und association_rules() importiert und pandas ist als pd verfügbar.

Diese Übung ist Teil des Kurses

Market Basket Analysis in Python

Anleitung zur Übung

Wende den Apriori-Algorithmus auf den DataFrame onehot an.
Berechne die Assoziationsregeln mit der Kennzahl support und einem minimalen Schwellenwert von 0,0.
Vervollständige den Ausdruck für das Streudiagramm, sodass die Punktgröße mit lift skaliert wird.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import seaborn under its standard alias
import seaborn as sns

# Apply the Apriori algorithm with a support value of 0.0075
frequent_itemsets = ____(____, min_support = 0.0075, 
                         use_colnames = True, max_len = 2)

# Generate association rules without performing additional pruning
rules = ____(frequent_itemsets, metric = "support", 
                          min_threshold = ____)

# Generate scatterplot using support and confidence
sns.scatterplot(x = "support", y = "confidence", 
                size = "____", data = rules)
plt.show()

Code bearbeiten und ausführen

Diese Übung ist Teil des Kurses

Market Basket Analysis in Python

Mittlere SchwierigkeitSchwierigkeitsgrad

4.9+

Kurs kostenlos starten

In diesem Kapitel lernst du die Grundlagen der Market Basket Analysis: Assoziationsregeln, Metriken und Pruning. Danach wendest du diese Konzepte an, um einem kleinen Lebensmittelladen bei Promotionen und der Produktplatzierung zu helfen.

Exercise 1: Was ist Market-Basket-Analyse?Exercise 2: Die Grundlagen der Market Basket Analysis Exercise 3: Cross-Selling von Produkten Exercise 4: Assoziationsregeln erkennen Exercise 5: Mehrere Antezedenten und Konsequenzen Exercise 6: Daten für Market Basket Analysis vorbereiten Exercise 7: Assoziationsregeln erzeugen Exercise 8: Die einfachste Kennzahl Exercise 9: Transaktionsdaten One-Hot encodieren Exercise 10: Den Support-Metrik berechnen

Assoziationsregeln zeigen, dass zwei oder mehr Artikel miteinander in Beziehung stehen. Metriken helfen uns, den Nutzen dieser Beziehungen zu quantifizieren. In diesem Kapitel wendest du sechs Metriken zur Bewertung von Assoziationsregeln an: Support, Confidence, Lift, Conviction, Leverage und Zhangs Metrik. Anschließend nutzt du Assoziationsregeln und Metriken, um eine Bibliothek und einen E-Book-Händler zu unterstützen.

Exercise 1: Konfidenz und Lift Exercise 2: Bücher mit Support empfehlen Exercise 3: Support mit Konfidenz verfeinern Exercise 4: Weitere Verfeinerung mit Lift Exercise 5: Leverage und Conviction Exercise 6: Lift versus Leverage Exercise 7: Conviction berechnen Exercise 8: Conviction mit einer Funktion berechnen Exercise 9: E-Books mit Conviction bewerben Exercise 10: Assoziation und Dissoziation Exercise 11: Assoziation und Dissoziation berechnen Exercise 12: Zhangs Kennzahl definieren Exercise 13: Zhangs Metrik anwenden Exercise 14: Fortgeschrittene Regeln Exercise 15: Filtern mit Support und Conviction Exercise 16: Cross-Promotion von Büchern mit Multi-Metrik-Filterung

Das grundlegende Problem der Market Basket Analysis besteht darin, riesige Mengen an Kundenentscheidungen in eine kleine Anzahl nützlicher Regeln zu überführen. Dieser Prozess beginnt typischerweise mit dem Apriori-Algorithmus und umfasst zusätzliche Strategien wie Pruning und Aggregation. In diesem Kapitel lernst du, wie du diese Methoden einsetzt, und wendest sie schließlich in Übungen an, in denen du einen Händler bei der Auswahl eines Ladenlayouts und bei produktübergreifenden Promotionen unterstützt.

Exercise 1: Aggregation Exercise 2: Aggregation durchführen Exercise 3: Eine Aggregationsfunktion definieren Exercise 4: Der Apriori-Algorithmus Exercise 5: Pruning und Apriori Exercise 6: Häufige Itemsets mit Apriori identifizieren Exercise 7: Auswahl einer Support-Schwelle Exercise 8: Grundlegtes Pruning von Apriori-Ergebnissen Exercise 9: Assoziationsregeln erzeugen Exercise 10: Pruning mit Lift Exercise 11: Pruning mit Confidence Exercise 12: Fortgeschrittenes Pruning von Apriori-Ergebnissen Exercise 13: Aggregation und Filtern Exercise 14: Zhangs Regel anwenden Exercise 15: Fortgeschrittenes Filtern mit mehreren Metriken

In diesem letzten Kapitel lernst du, wie Visualisierungen den Pruning-Prozess unterstützen und Endergebnisse zusammenfassen, die typischerweise als Itemsets oder Regeln vorliegen. Du beherrschst danach die drei wichtigsten Visualisierungen – Heatmaps, Scatterplots und Parallelkoordinaten-Diagramme – und wendest sie an, um einen Film-Streaming-Dienst zu unterstützen.

Exercise 1: Heatmaps Exercise 2: Visualisierung des Itemset-Supports Exercise 3: Heatmaps mit Lift Exercise 4: Heatmaps interpretieren Exercise 5: Streudiagramme Exercise 6: Pruning mit Streudiagrammen Exercise 7: Optimalität der Support-Confidence-Grenze

Aktuelle Übung

Exercise 8: Parallelkoordinaten-Diagramm Exercise 9: Regeln mit Parallelkoordinaten visualisieren Exercise 10: Ein Parallelkoordinaten-Diagramm verfeinern Exercise 11: Glückwunsch!