Pruning mit Confidence

Schon wieder hast du zu viele Treffer: Du hast mehrere nützliche Regeln gefunden, kannst sie aber nicht auf eine einzige eingrenzen. Noch schlimmer: Die beiden gefundenen Regeln verwenden dasselbe Itemset, haben aber Antezedenz und Konsequent einfach vertauscht. Du willst prüfen, ob das Pruning nach einer anderen Kennzahl dir hilft, auf genau eine Assoziationsregel einzugrenzen.

Welche Kennzahl ist hier die richtige? Sowohl Lift als auch Support sind für alle Regeln identisch, die aus einem Itemset erzeugt werden können. Deshalb entscheidest du dich für Confidence, die sich bei Regeln aus demselben Itemset unterscheidet. Beachte: pandas ist als pd verfügbar und die One-Hot-kodierten Transaktionsdaten als onehot. Außerdem wurde apriori aus mlxtend importiert.

Diese Übung ist Teil des Kurses

Market Basket Analysis in Python

Anleitung zur Übung

Importiere association_rules aus mlxtend.
Vervollständige den Aufruf des apriori-Algorithmus mit einem Support-Wert von 0,0015 und einer maximalen Itemset-Länge von 2.
Vervollständige den Aufruf für die Assoziationsregeln, mit Confidence als Metrik und einem Schwellwert von 0,5.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import the association rules function
____

# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = ____(onehot, ____, 
                            ____, use_colnames = True)

# Compute all association rules using confidence
rules = ____(frequent_itemsets, 
                            metric = "____", 
                         	min_threshold = ____)

# Print association rules
print(rules)

Code bearbeiten und ausführen

Diese Übung ist Teil des Kurses

Market Basket Analysis in Python

Mittlere SchwierigkeitSchwierigkeitsgrad

4.9+

Kurs kostenlos starten

In diesem Kapitel lernst du die Grundlagen der Market Basket Analysis: Assoziationsregeln, Metriken und Pruning. Danach wendest du diese Konzepte an, um einem kleinen Lebensmittelladen bei Promotionen und der Produktplatzierung zu helfen.

Exercise 1: Was ist Market-Basket-Analyse?Exercise 2: Die Grundlagen der Market Basket Analysis Exercise 3: Cross-Selling von Produkten Exercise 4: Assoziationsregeln erkennen Exercise 5: Mehrere Antezedenten und Konsequenzen Exercise 6: Daten für Market Basket Analysis vorbereiten Exercise 7: Assoziationsregeln erzeugen Exercise 8: Die einfachste Kennzahl Exercise 9: Transaktionsdaten One-Hot encodieren Exercise 10: Den Support-Metrik berechnen

Assoziationsregeln zeigen, dass zwei oder mehr Artikel miteinander in Beziehung stehen. Metriken helfen uns, den Nutzen dieser Beziehungen zu quantifizieren. In diesem Kapitel wendest du sechs Metriken zur Bewertung von Assoziationsregeln an: Support, Confidence, Lift, Conviction, Leverage und Zhangs Metrik. Anschließend nutzt du Assoziationsregeln und Metriken, um eine Bibliothek und einen E-Book-Händler zu unterstützen.

Exercise 1: Konfidenz und Lift Exercise 2: Bücher mit Support empfehlen Exercise 3: Support mit Konfidenz verfeinern Exercise 4: Weitere Verfeinerung mit Lift Exercise 5: Leverage und Conviction Exercise 6: Lift versus Leverage Exercise 7: Conviction berechnen Exercise 8: Conviction mit einer Funktion berechnen Exercise 9: E-Books mit Conviction bewerben Exercise 10: Assoziation und Dissoziation Exercise 11: Assoziation und Dissoziation berechnen Exercise 12: Zhangs Kennzahl definieren Exercise 13: Zhangs Metrik anwenden Exercise 14: Fortgeschrittene Regeln Exercise 15: Filtern mit Support und Conviction Exercise 16: Cross-Promotion von Büchern mit Multi-Metrik-Filterung

Das grundlegende Problem der Market Basket Analysis besteht darin, riesige Mengen an Kundenentscheidungen in eine kleine Anzahl nützlicher Regeln zu überführen. Dieser Prozess beginnt typischerweise mit dem Apriori-Algorithmus und umfasst zusätzliche Strategien wie Pruning und Aggregation. In diesem Kapitel lernst du, wie du diese Methoden einsetzt, und wendest sie schließlich in Übungen an, in denen du einen Händler bei der Auswahl eines Ladenlayouts und bei produktübergreifenden Promotionen unterstützt.

Exercise 1: Aggregation Exercise 2: Aggregation durchführen Exercise 3: Eine Aggregationsfunktion definieren Exercise 4: Der Apriori-Algorithmus Exercise 5: Pruning und Apriori Exercise 6: Häufige Itemsets mit Apriori identifizieren Exercise 7: Auswahl einer Support-Schwelle Exercise 8: Grundlegtes Pruning von Apriori-Ergebnissen Exercise 9: Assoziationsregeln erzeugen Exercise 10: Pruning mit Lift Exercise 11: Pruning mit Confidence

Aktuelle Übung

Exercise 12: Fortgeschrittenes Pruning von Apriori-Ergebnissen Exercise 13: Aggregation und Filtern Exercise 14: Zhangs Regel anwenden Exercise 15: Fortgeschrittenes Filtern mit mehreren Metriken

In diesem letzten Kapitel lernst du, wie Visualisierungen den Pruning-Prozess unterstützen und Endergebnisse zusammenfassen, die typischerweise als Itemsets oder Regeln vorliegen. Du beherrschst danach die drei wichtigsten Visualisierungen – Heatmaps, Scatterplots und Parallelkoordinaten-Diagramme – und wendest sie an, um einen Film-Streaming-Dienst zu unterstützen.

Exercise 1: Heatmaps Exercise 2: Visualisierung des Itemset-Supports Exercise 3: Heatmaps mit Lift Exercise 4: Heatmaps interpretieren Exercise 5: Streudiagramme Exercise 6: Pruning mit Streudiagrammen Exercise 7: Optimalität der Support-Confidence-Grenze Exercise 8: Parallelkoordinaten-Diagramm Exercise 9: Regeln mit Parallelkoordinaten visualisieren Exercise 10: Ein Parallelkoordinaten-Diagramm verfeinern Exercise 11: Glückwunsch!