CommencerCommencer gratuitement

Filtrer avec le support et la conviction

Dans la vidéo, nous avons évoqué la mission de conseil que vous poursuivez pour la fondatrice d’une start-up de vente d’ebooks. Elle vous a transmis le DataFrame rules, qui contient le travail d’un data scientist précédemment en poste. Il inclut des colonnes pour les antécédents et les conséquents, ainsi que les performances de chacune de ces règles selon plusieurs métriques.

Votre objectif est d’appliquer un filtrage multi-métriques au jeu de données pour identifier des règles potentiellement utiles. Notez que pandas est disponible sous pd et numpy sous np. De plus, rules a déjà été défini et est disponible.

Cet exercice fait partie du cours

Analyse des paniers d’achat en Python

Afficher le cours

Instructions

  • Utilisez la méthode .head() avec print pour prévisualiser le jeu de données.
  • Sélectionnez le sous-ensemble de règles dont le support des antécédents est supérieur à 0,05.
  • Sélectionnez le sous-ensemble de règles dont le support des conséquents est supérieur à 0,02.
  • Sélectionnez le sous-ensemble de règles dont la conviction est supérieure à 1,01.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Preview the rules DataFrame using the .head() method
print(____)

# Select the subset of rules with antecedent support greater than 0.05
rules = rules[rules['antecedent support'] > ____]

# Select the subset of rules with a consequent support greater than 0.02
rules = rules[____]

# Select the subset of rules with a conviction greater than 1.01
rules = ____

# Print remaining rules
print(rules)
Modifier et exécuter le code