LoslegenKostenlos loslegen

Häufige Itemsets mit Apriori identifizieren

Die Aggregationsübung, die du für den Onlinehändler durchgeführt hast, war hilfreich. Sie bot einen Ausgangspunkt, um zu verstehen, welche Kategorien von Artikeln in Transaktionen häufig vorkommen. Der Händler möchte nun die einzelnen Artikel selbst untersuchen, um herauszufinden, welche häufig sind.

In dieser Übung wendest du den Apriori-Algorithmus auf den Online-Retail-Datensatz an, ohne vorher zu aggregieren. Dein Ziel ist es, die Itemsets mithilfe eines minimalen Supportwerts und einer Obergrenze für die Anzahl der Items zu beschneiden (pruning). Beachte, dass pandas als pd importiert wurde und die One-Hot-codierten Daten als onehot verfügbar sind.

Diese Übung ist Teil des Kurses

Market Basket Analysis in Python

Kurs anzeigen

Anleitung zur Übung

  • Übergib onehot an den Apriori-Algorithmus.
  • Setze den minimalen Supportwert auf 0,006.
  • Setze die maximale Itemset-Länge auf 3.
  • Gib eine Vorschau der ersten fünf Itemsets aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import apriori from mlxtend
from mlxtend.frequent_patterns import apriori

# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = apriori(____, 
                            ____ = ____, 
                            max_len = ____, 
                            use_colnames = True)

# Print a preview of the frequent itemsets
print(____.head())
Code bearbeiten und ausführen