Menghitung asosiasi dan disosiasi
Perpustakaan kembali menghubungi Anda terkait rekomendasi untuk mempromosikan Harry Potter menggunakan Twilight. Mereka khawatir keduanya mungkin saling terdisosiasi, yang dapat berdampak negatif pada upaya promosi. Mereka meminta Anda memverifikasi bahwa hal tersebut tidak terjadi.
Anda langsung teringat pada metrik Zhang, yang mengukur asosiasi dan disosiasi secara kontinu. Asosiasi bernilai positif dan disosiasi bernilai negatif. Seperti pada latihan sebelumnya, DataFrame books telah diimpor untuk Anda, bersama numpy dengan alias np. Metrik Zhang dihitung sebagai berikut:
$$Zhang(A \rightarrow B) = $$ $$\frac{Support(A \& B) - Support(A) Support(B)}{ max[Support(AB) (1-Support(A)), Support(A)(Support(B)-Support(AB))]}$$
Latihan ini adalah bagian dari kursus
Analisis Market Basket dengan Python
Petunjuk latihan
- Hitung support untuk {Twilight} dan support untuk {Potter}.
- Hitung support untuk {Twilight, Potter}.
- Lengkapi ekspresi untuk penyebut.
- Hitung metrik Zhang untuk {Twilight} \(\rightarrow\) {Potter}.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Compute the support of Twilight and Harry Potter
supportT = books['Twilight'].____
supportP = books['Potter'].____
# Compute the support of both books
supportTP = ____.mean()
# Complete the expressions for the numerator and denominator
numerator = supportTP - supportT*supportP
denominator = ___(supportTP*(1-supportT), supportT*(supportP-supportTP))
# Compute and print Zhang's metric
zhang = ____ / ____
print(zhang)