Recommander des livres avec le support
Une bibliothèque souhaite encourager ses membres à lire davantage et a décidé d’utiliser l’analyse du panier d’achats pour savoir comment s’y prendre. Elle vous sollicite pour mener l’analyse et vous demande d’utiliser les cinq livres les mieux notés du jeu de données goodbooks-10k, présenté dans la vidéo. Les données vous sont fournies en format « one-hot encoding » dans un DataFrame pandas nommé books.
Chaque colonne du DataFrame correspond à un livre et prend la valeur TRUE si le livre figure dans la bibliothèque d’un lecteur et qu’il est très bien noté. Pour simplifier, nous travaillerons avec des noms abrégés : Hunger, Potter et Twilight.
Cet exercice fait partie du cours
Analyse des paniers d’achat en Python
Instructions
- Calculez le support pour {Hunger, Potter}.
- Calculez le support pour {Hunger, Twilight}.
- Calculez le support pour {Potter, Twilight}.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute support for Hunger and Potter
supportHP = np.logical_and(books['Hunger'], books['____']).mean()
# Compute support for Hunger and Twilight
supportHT = ____(books['Hunger'], books['Twilight']).mean()
# Compute support for Potter and Twilight
supportPT = np.logical_and(books['Potter'], books['Twilight']).____
# Print support values
print("Hunger Games and Harry Potter: %.2f" % supportHP)
print("Hunger Games and Twilight: %.2f" % supportHT)
print("Harry Potter and Twilight: %.2f" % supportPT)