Aan de slagGa gratis aan de slag

Regels visualiseren met parallelle coördinaten

Je visuele demonstratie in de vorige oefening heeft de oprichter overtuigd dat de grens tussen support en confidence het waard is om verder te onderzoeken. Ze stelt nu voor om een deel van die grens te extraheren en te visualiseren. Omdat de regels op de grens sterk zijn volgens de meeste gangbare metrieken, vindt ze dat je simpelweg moet visualiseren of een regel bestaat, in plaats van de intensiteit van de regel volgens een of andere metriek.

Je beseft dat een parallelle-coördinatenplot ideaal is voor dit soort gevallen. De data is voor je geïmporteerd als onehot. Daarnaast zijn apriori(), association_rules() en parallel_coordinates() geïmporteerd, en is pandas beschikbaar als pd. De functie rules_to_coordinates() is gedefinieerd en beschikbaar.

Deze oefening maakt deel uit van de cursus

Market Basket Analysis in Python

Cursus bekijken

Oefeninstructies

  • Voltooi de Apriori-aanroep met een minimale support van 0,05.
  • Bereken associatieregels met een minimale confidence-drempel van 0,50. Dit is hoog genoeg om uitsluitend punten vast te leggen dicht bij het bovenste deel van de support-confidencegrens.
  • Zet de regels om naar coördinaten.
  • Plot de coördinaten met parallel_coordinates().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Compute the frequent itemsets
frequent_itemsets = ____(onehot, min_support = ____, 
                         use_colnames = True, max_len = 2)

# Compute rules from the frequent itemsets with the confidence metric
rules = association_rules(frequent_itemsets, metric = '____', 
                          min_threshold = 0.50)

# Convert rules into coordinates suitable for use in a parallel coordinates plot
coords = rules_to_coordinates(____)

# Generate parallel coordinates plot
parallel_coordinates(____, 'rule')
plt.legend([])
plt.show()
Code bewerken en uitvoeren