Affiner l’analyse avec le lift

Encore une fois, vous transmettez vos résultats à la bibliothèque : utilisez Twilight pour promouvoir Harry Potter, car cette règle présente une métrique de confiance plus élevée. La bibliothèque vous remercie pour la suggestion, mais vous demande de confirmer qu’il s’agit d’une relation pertinente à l’aide d’une autre métrique.

Vous vous souvenez que le lift peut être utile ici. Si le lift est inférieur à 1, cela signifie que Harry Potter et Twilight sont associés moins fréquemment que ce à quoi on s’attendrait si les associations étaient dues au hasard. Comme dans les deux exercices précédents, le DataFrame books a été importé pour vous, ainsi que numpy sous l’alias np.

Cet exercice fait partie du cours

<cours>Analyse des paniers d’achat en Python</cours>

Instructions de l’exercice

Calculez le support de {Potter, Twilight}.
Calculez le support de {Potter}.
Calculez le support de {Twilight}.
Calculez le lift de {Potter} \(\rightarrow\) {Twilight}.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Compute support for Potter and Twilight
supportPT = ____.mean()

# Compute support for Potter
supportP = books['Potter'].____

# Compute support for Twilight
supportT = ____.mean()

# Compute lift
lift = ____ / (supportP * ____)

# Print lift
print("Lift: %.2f" % lift)

Modifier et exécuter le code

Cet exercice fait partie du cours

<cours>Analyse des paniers d’achat en Python</cours>

IntermédiaireNiveau de compétence

4.9+

Commencer le cours gratuitement

Dans ce chapitre, vous découvrirez les bases de l’Analyse des paniers d’achat : règles d’association, métriques et élagage. Vous appliquerez ensuite ces concepts pour aider une petite épicerie à améliorer ses actions promotionnelles et l’implantation de ses produits.

Exercise 1: Qu’est-ce que l’analyse de panier ?Exercise 2: Les bases de l'analyse du panier d'achat Exercise 3: Vente croisée de produits Exercise 4: Identifier des règles d’association Exercise 5: Antécédents et conséquents multiples Exercise 6: Préparer les données pour l’analyse des paniers Exercise 7: Générer des règles d’association Exercise 8: La métrique la plus simple Exercise 9: One-hot encoder des données de transaction Exercise 10: Calculer la métrique de support

Les règles d’association indiquent que deux éléments ou plus sont liés. Les métriques nous permettent de quantifier l’intérêt de ces relations. Dans ce chapitre, vous appliquerez six métriques pour évaluer des règles d’association : support, confiance, lift, conviction, levier et la métrique de Zhang. Vous utiliserez ensuite les règles d’association et ces métriques pour aider une bibliothèque et un vendeur d’e-books.

Exercise 1: Confiance et lift Exercise 2: Recommander des livres avec le support Exercise 3: Affiner le support avec la confiance Exercise 4: Affiner l’analyse avec le lift

Exercice actuel

Exercise 5: Leverage et conviction Exercise 6: Lift versus leverage Exercise 7: Calculer la conviction Exercise 8: Calculer la conviction avec une fonction Exercise 9: Promouvoir des ebooks avec la conviction Exercise 10: Association et dissociation Exercise 11: Calculer l’association et la dissociation Exercise 12: Définir la métrique de Zhang Exercise 13: Appliquer la mesure de Zhang Exercise 14: Règles avancées Exercise 15: Filtrer avec le support et la conviction Exercise 16: Utiliser un filtrage multi-métriques pour faire de la promotion croisée de livres

Le défi central de l’Analyse des paniers d’achat consiste à convertir un très grand nombre de décisions clients en un petit ensemble de règles utiles. Ce processus commence généralement par l’algorithme Apriori et s’appuie sur des stratégies complémentaires, comme l’élagage et l’agrégation. Dans ce chapitre, vous apprendrez à utiliser ces méthodes et les appliquerez dans des exercices où vous aiderez un détaillant à choisir l’agencement d’un magasin physique et à mettre en place des ventes croisées de produits.

Exercise 1: Agrégation Exercise 2: Réaliser une agrégation Exercise 3: Définir une fonction d’agrégation Exercise 4: L’algorithme Apriori Exercise 5: Élagage et Apriori Exercise 6: Identifier des itemsets fréquents avec Apriori Exercise 7: Choisir un seuil de support Exercise 8: Pruning de base des résultats d’Apriori Exercise 9: Générer des règles d’association Exercise 10: Élagage avec le lift Exercise 11: Élagage par la confiance Exercise 12: Élagage avancé des résultats d’Apriori Exercise 13: Agrégation et filtrage Exercise 14: Appliquer la règle de Zhang Exercise 15: Filtrage avancé avec plusieurs métriques

Dans ce dernier chapitre, vous verrez comment les visualisations guident le processus d’élagage et synthétisent les résultats finaux, qui prennent généralement la forme d’ensembles d’articles ou de règles. Vous maîtriserez les trois visualisations les plus utiles — cartes thermiques, nuages de points et graphiques en coordonnées parallèles — et vous les appliquerez pour aider un service de streaming de films.

Exercise 1: Cartes thermiques Exercise 2: Visualiser le support des itemsets Exercise 3: Cartes thermiques avec lift Exercise 4: Interpréter les cartes thermiques Exercise 5: Nuages de points Exercise 6: Élagage avec des nuages de points Exercise 7: Optimalité de la frontière support–confiance Exercise 8: Diagramme en coordonnées parallèles Exercise 9: Utiliser des coordonnées parallèles pour visualiser des règles Exercise 10: Affiner un diagramme de coordonnées parallèles Exercise 11: Félicitations !