CommencerCommencer gratuitement

Calculer l’association et la dissociation

La bibliothèque revient vers vous au sujet de votre recommandation de promouvoir Harry Potter en s’appuyant sur Twilight. Elle craint que les deux titres soient dissociés, ce qui pourrait nuire à leur campagne. Elle vous demande de vérifier que ce n’est pas le cas.

Vous pensez immédiatement à la métrique de Zhang, qui mesure en continu l’association et la dissociation. L’association est positive et la dissociation est négative. Comme dans les exercices précédents, le DataFrame books a été importé pour vous, ainsi que numpy sous l’alias np. La métrique de Zhang se calcule comme suit :

$$Zhang(A \rightarrow B) = $$ $$\frac{Support(A \& B) - Support(A) Support(B)}{ max[Support(AB) (1-Support(A)), Support(A)(Support(B)-Support(AB))]}$$

Cet exercice fait partie du cours

Analyse des paniers d’achat en Python

Afficher le cours

Instructions

  • Calculez le support de {Twilight} et le support de {Potter}.
  • Calculez le support de {Twilight, Potter}.
  • Complétez l’expression du dénominateur.
  • Calculez la métrique de Zhang pour {Twilight} \(\rightarrow\) {Potter}.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute the support of Twilight and Harry Potter
supportT = books['Twilight'].____
supportP = books['Potter'].____

# Compute the support of both books
supportTP = ____.mean()

# Complete the expressions for the numerator and denominator
numerator = supportTP - supportT*supportP
denominator = ___(supportTP*(1-supportT), supportT*(supportP-supportTP))

# Compute and print Zhang's metric
zhang = ____ / ____
print(zhang)
Modifier et exécuter le code