Aan de slagGa gratis aan de slag

Beperkte data in je rijen

Deze dataschaarste kan een probleem veroorzaken bij technieken zoals K-nearest neighbors, zoals besproken in het vorige hoofdstuk. KNN moet de k meest vergelijkbare gebruikers vinden die een item hebben beoordeeld, maar als slechts k of minder gebruikers een item hebben beoordeeld, zijn alle beoordelingen even "vergelijkbaar".

In deze oefening tel je hoe vaak elke film in de DataFrame user_ratings_df een beoordeling heeft gekregen, en bekijk je vervolgens hoeveel films slechts één of twee beoordelingen hebben.

Deze oefening maakt deel uit van de cursus

Aanbevelingssystemen bouwen in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Count the occupied cells per column
occupied_count = user_ratings_df.____().____()
print(occupied_count)
Code bewerken en uitvoeren