Améliorer les recommandations non personnalisées

Ce n’est pas parce qu’un film a été beaucoup regardé que les spectateurs l’ont apprécié. Pour comprendre ce qu’un spectateur a réellement pensé d’un film, des données plus explicites sont utiles. Heureusement, vous disposez aussi des notes attribuées par chaque spectateur dans le jeu de données Movie Lens.

Dans cet exercice, vous allez calculer la note moyenne de chaque film du jeu de données, puis identifier le film avec la meilleure note moyenne.

Vous utiliserez le même user_ratings_df que dans l’exercice précédent, déjà chargé pour vous.

Cet exercice fait partie du cours

<cours>Créer des moteurs de recommandation en Python</cours>

Voir le cours

Instructions de l’exercice

Calculez la note moyenne pour chacun des films et enregistrez le résultat dans un DataFrame nommé average_rating_df.
Triez le DataFrame average_rating_df selon la colonne rating moyenne, de la plus élevée à la plus faible, et stockez-le dans sorted_average_ratings.
Affichez les entrées correspondant aux cinq films les mieux classés dans sorted_average_ratings.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Find the mean of the ratings given to each title
average_rating_df = user_ratings_df[["title", "rating"]].____('title').____()

# Order the entries by highest average rating to lowest
sorted_average_ratings = average_rating_df.____(____=____, ____=____)

# Inspect the top movies
print(____.____())

Modifier et exécuter le code