Beperkte data in je rijen
Deze dataschaarste kan een probleem veroorzaken bij technieken zoals K-nearest neighbors, zoals besproken in het vorige hoofdstuk. KNN moet de k meest vergelijkbare gebruikers vinden die een item hebben beoordeeld, maar als slechts k of minder gebruikers een item hebben beoordeeld, zijn alle beoordelingen even "vergelijkbaar".
In deze oefening tel je hoe vaak elke film in de DataFrame user_ratings_df een beoordeling heeft gekregen, en bekijk je vervolgens hoeveel films slechts één of twee beoordelingen hebben.
Deze oefening maakt deel uit van de cursus
Aanbevelingssystemen bouwen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Count the occupied cells per column
occupied_count = user_ratings_df.____().____()
print(occupied_count)