Verder verfijnen met lift
Je rapporteert je resultaten opnieuw aan de bibliotheek: Gebruik Twilight om Harry Potter te promoten, omdat de regel een hogere confidence-metriek heeft. De bibliotheek bedankt je voor de suggestie, maar vraagt je te bevestigen dat dit een betekenisvolle relatie is met een andere metriek.
Je herinnert je dat lift hier nuttig kan zijn. Als lift kleiner is dan 1, betekent dit dat Harry Potter en Twilight minder vaak samen voorkomen dan je zou verwachten als de koppelingen door toeval tot stand komen. Net als in de vorige twee oefeningen is de DataFrame books voor je geïmporteerd, samen met numpy onder de alias np.
Deze oefening maakt deel uit van de cursus
Market Basket Analysis in Python
Oefeninstructies
- Bereken de support van {Potter, Twilight}.
- Bereken de support van {Potter}.
- Bereken de support van {Twilight}.
- Bereken de lift van {Potter} \(\rightarrow\) {Twilight}.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Compute support for Potter and Twilight
supportPT = ____.mean()
# Compute support for Potter
supportP = books['Potter'].____
# Compute support for Twilight
supportT = ____.mean()
# Compute lift
lift = ____ / (supportP * ____)
# Print lift
print("Lift: %.2f" % lift)