Calcolare associazione e dissociazione
La biblioteca è tornata da te ancora una volta riguardo alla tua raccomandazione di promuovere Harry Potter usando Twilight. Temono che i due possano essere dissociati, il che potrebbe avere un impatto negativo sulla loro promozione. Ti chiedono di verificare che non sia così.
Ti viene subito in mente la metrica di Zhang, che misura in modo continuo associazione e dissociazione. L’associazione è positiva e la dissociazione è negativa. Come negli esercizi precedenti, il DataFrame books è già stato importato per te, insieme a numpy con l’alias np. La metrica di Zhang si calcola come segue:
$$Zhang(A \rightarrow B) = $$ $$\frac{Support(A \& B) - Support(A) Support(B)}{ max[Support(AB) (1-Support(A)), Support(A)(Support(B)-Support(AB))]}$$
Questo esercizio fa parte del corso
Analisi del carrello in Python
Istruzioni dell'esercizio
- Calcola il supporto di {Twilight} e il supporto di {Potter}.
- Calcola il supporto di {Twilight, Potter}.
- Completa l’espressione per il denominatore.
- Calcola la metrica di Zhang per {Twilight} \(\rightarrow\) {Potter}.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Compute the support of Twilight and Harry Potter
supportT = books['Twilight'].____
supportP = books['Potter'].____
# Compute the support of both books
supportTP = ____.mean()
# Complete the expressions for the numerator and denominator
numerator = supportTP - supportT*supportP
denominator = ___(supportTP*(1-supportT), supportT*(supportP-supportTP))
# Compute and print Zhang's metric
zhang = ____ / ____
print(zhang)