Affiner l’analyse avec le lift
Encore une fois, vous transmettez vos résultats à la bibliothèque : utilisez Twilight pour promouvoir Harry Potter, car cette règle présente une métrique de confiance plus élevée. La bibliothèque vous remercie pour la suggestion, mais vous demande de confirmer qu’il s’agit d’une relation pertinente à l’aide d’une autre métrique.
Vous vous souvenez que le lift peut être utile ici. Si le lift est inférieur à 1, cela signifie que Harry Potter et Twilight sont associés moins fréquemment que ce à quoi on s’attendrait si les associations étaient dues au hasard. Comme dans les deux exercices précédents, le DataFrame books a été importé pour vous, ainsi que numpy sous l’alias np.
Cet exercice fait partie du cours
Analyse des paniers d’achat en Python
Instructions
- Calculez le support de {Potter, Twilight}.
- Calculez le support de {Potter}.
- Calculez le support de {Twilight}.
- Calculez le lift de {Potter} \(\rightarrow\) {Twilight}.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute support for Potter and Twilight
supportPT = ____.mean()
# Compute support for Potter
supportP = books['Potter'].____
# Compute support for Twilight
supportT = ____.mean()
# Compute lift
lift = ____ / (supportP * ____)
# Print lift
print("Lift: %.2f" % lift)