Aan de slagBegin gratis

Beperkte data in je rijen

Deze dataschaarste kan een probleem veroorzaken bij technieken zoals K-nearest neighbors, zoals besproken in het vorige hoofdstuk. KNN moet de k meest vergelijkbare gebruikers vinden die een item hebben beoordeeld, maar als slechts k of minder gebruikers een item hebben beoordeeld, zijn alle beoordelingen even "vergelijkbaar".

In deze oefening tel je hoe vaak elke film in de DataFrame user_ratings_df een beoordeling heeft gekregen, en bekijk je vervolgens hoeveel films slechts één of twee beoordelingen hebben.

Deze oefening maakt deel uit van de cursus

Aanbevelingssystemen bouwen in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Count the occupied cells per column
occupied_count = user_ratings_df.____().____()
print(occupied_count)
Code bewerken en uitvoeren