Verbeterde niet-gepersonaliseerde aanbevelingen
Dat een film door veel mensen is bekeken, betekent niet per se dat kijkers hem ook leuk vonden. Om te begrijpen wat een kijker echt van een film vond, zijn explicietere gegevens handig. Gelukkig heb je in de Movie Lens-gegevensset ook beoordelingen van elke kijker.
In deze oefening bereken je de gemiddelde beoordeling van elke film in de gegevensset en zoek je vervolgens de film met de hoogste gemiddelde beoordeling.
Je gebruikt dezelfde user_ratings_df als in de vorige oefening; deze is alvast voor je geladen.
Deze oefening maakt deel uit van de cursus
Aanbevelingssystemen bouwen in Python
Oefeninstructies
- Bereken de gemiddelde beoordeling voor elke film en sla dit op als een DataFrame met de naam
average_rating_df. - Sorteer het DataFrame
average_rating_dfop de gemiddelde kolomratingvan hoog naar laag en sla dit op alssorted_average_ratings. - Print de rijen voor de vijf hoogst gewaardeerde films in
sorted_average_ratings.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Find the mean of the ratings given to each title
average_rating_df = user_ratings_df[["title", "rating"]].____('title').____()
# Order the entries by highest average rating to lowest
sorted_average_ratings = average_rating_df.____(____=____, ____=____)
# Inspect the top movies
print(____.____())