LoslegenKostenlos loslegen

Regeln mit Parallelkoordinaten visualisieren

Deine Visualisierung in der vorherigen Übung hat die Gründerin überzeugt, dass die Supply-Confidence-Grenze eine nähere Untersuchung wert ist. Sie schlägt nun vor, einen Teil dieser Grenze zu extrahieren und zu visualisieren. Da die Regeln auf der Grenze in Bezug auf die gängigsten Metriken stark sind, argumentiert sie, dass du einfach nur darstellen solltest, ob eine Regel existiert – und nicht die Stärke der Regel nach irgendeiner Metrik.

Du erkennst, dass sich ein Parallelkoordinaten-Plot für solche Fälle ideal eignet. Die Daten wurden als onehot für dich importiert. Außerdem wurden apriori(), association_rules() und parallel_coordinates() importiert, und pandas ist als pd verfügbar. Die Funktion rules_to_coordinates() wurde definiert und steht bereit.

Diese Übung ist Teil des Kurses

Market Basket Analysis in Python

Kurs anzeigen

Anleitung zur Übung

  • Ergänze den Aufruf des Apriori-Algorithmus mit einem minimalen Support von 0,05.
  • Berechne Assoziationsregeln mit einem Mindestkonfidenz-Schwellenwert von 0,50. Das ist hoch genug, um ausschließlich Punkte im oberen Bereich der Supply-Confidence-Grenze zu erfassen.
  • Wandle die Regeln in Koordinaten um.
  • Stelle die Koordinaten mit parallel_coordinates() dar.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Compute the frequent itemsets
frequent_itemsets = ____(onehot, min_support = ____, 
                         use_colnames = True, max_len = 2)

# Compute rules from the frequent itemsets with the confidence metric
rules = association_rules(frequent_itemsets, metric = '____', 
                          min_threshold = 0.50)

# Convert rules into coordinates suitable for use in a parallel coordinates plot
coords = rules_to_coordinates(____)

# Generate parallel coordinates plot
parallel_coordinates(____, 'rule')
plt.legend([])
plt.show()
Code bearbeiten und ausführen