CommencerCommencer gratuitement

Utiliser des coordonnées parallèles pour visualiser des règles

Votre démonstration visuelle dans l’exercice précédent a convaincu la fondatrice que la frontière support-confiance mérite d’être explorée davantage. Elle vous suggère maintenant d’en extraire une partie et de la visualiser. Comme les règles situées sur cette frontière sont fortes selon la plupart des métriques courantes, elle estime qu’il suffit de visualiser l’existence d’une règle, plutôt que son intensité selon une métrique donnée.

Vous réalisez qu’un graphique en coordonnées parallèles est idéal dans ce cas. Les données ont été importées pour vous sous le nom onehot. De plus, apriori(), association_rules() et parallel_coordinates() ont été importées, et pandas est disponible sous pd. La fonction rules_to_coordinates() a été définie et est disponible.

Cet exercice fait partie du cours

Analyse des paniers d’achat en Python

Afficher le cours

Instructions

  • Complétez l’appel à l’algorithme Apriori en utilisant un support minimal de 0,05.
  • Calculez les règles d’association avec un seuil de confiance minimal de 0,50. C’est suffisamment élevé pour ne capturer que les points proches de la partie supérieure de la frontière support-confiance.
  • Convertissez les règles en coordonnées.
  • Tracez les coordonnées avec parallel_coordinates().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute the frequent itemsets
frequent_itemsets = ____(onehot, min_support = ____, 
                         use_colnames = True, max_len = 2)

# Compute rules from the frequent itemsets with the confidence metric
rules = association_rules(frequent_itemsets, metric = '____', 
                          min_threshold = 0.50)

# Convert rules into coordinates suitable for use in a parallel coordinates plot
coords = rules_to_coordinates(____)

# Generate parallel coordinates plot
parallel_coordinates(____, 'rule')
plt.legend([])
plt.show()
Modifier et exécuter le code