Associatie en dissociatie berekenen
De bibliotheek komt opnieuw bij je terug over je aanbeveling om Harry Potter te promoten met behulp van Twilight. Ze maken zich zorgen dat de twee mogelijk gedissocieerd zijn, wat een negatief effect kan hebben op hun promotie. Ze vragen je te verifiëren dat dit niet zo is.
Je denkt meteen aan Zhangs maat, die associatie en dissociatie continu meet. Associatie is positief en dissociatie is negatief. Net als in de vorige oefeningen is de DataFrame books al voor je geïmporteerd, samen met numpy als alias np. Zhangs maat wordt als volgt berekend:
$$Zhang(A \rightarrow B) = $$ $$\frac{Support(A \& B) - Support(A) Support(B)}{ max[Support(AB) (1-Support(A)), Support(A)(Support(B)-Support(AB))]}$$
Deze oefening maakt deel uit van de cursus
Market Basket Analysis in Python
Oefeninstructies
- Bereken de support van {Twilight} en de support van {Potter}.
- Bereken de support van {Twilight, Potter}.
- Vul de expressie voor de noemer aan.
- Bereken Zhangs maat voor {Twilight} \(\rightarrow\) {Potter}.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Compute the support of Twilight and Harry Potter
supportT = books['Twilight'].____
supportP = books['Potter'].____
# Compute the support of both books
supportTP = ____.mean()
# Complete the expressions for the numerator and denominator
numerator = supportTP - supportT*supportP
denominator = ___(supportTP*(1-supportT), supportT*(supportP-supportTP))
# Compute and print Zhang's metric
zhang = ____ / ____
print(zhang)