CommencerCommencer gratuitement

Recommander des livres avec le support

Une bibliothèque souhaite encourager ses membres à lire davantage et a décidé d’utiliser l’analyse du panier d’achats pour savoir comment s’y prendre. Elle vous sollicite pour mener l’analyse et vous demande d’utiliser les cinq livres les mieux notés du jeu de données goodbooks-10k, présenté dans la vidéo. Les données vous sont fournies en format « one-hot encoding » dans un DataFrame pandas nommé books.

Chaque colonne du DataFrame correspond à un livre et prend la valeur TRUE si le livre figure dans la bibliothèque d’un lecteur et qu’il est très bien noté. Pour simplifier, nous travaillerons avec des noms abrégés : Hunger, Potter et Twilight.

Cet exercice fait partie du cours

Analyse des paniers d’achat en Python

Afficher le cours

Instructions

  • Calculez le support pour {Hunger, Potter}.
  • Calculez le support pour {Hunger, Twilight}.
  • Calculez le support pour {Potter, Twilight}.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute support for Hunger and Potter
supportHP = np.logical_and(books['Hunger'], books['____']).mean()

# Compute support for Hunger and Twilight
supportHT = ____(books['Hunger'], books['Twilight']).mean()

# Compute support for Potter and Twilight
supportPT = np.logical_and(books['Potter'], books['Twilight']).____

# Print support values
print("Hunger Games and Harry Potter: %.2f" % supportHP)
print("Hunger Games and Twilight: %.2f" % supportHT)
print("Harry Potter and Twilight: %.2f" % supportPT)
Modifier et exécuter le code