Begrenzte Daten in deinen Zeilen
Diese Datensparsamkeit kann bei Techniken wie K-nearest neighbors, wie im letzten Kapitel besprochen, zu Problemen führen. KNN muss die k ähnlichsten Nutzer:innen finden, die ein Item bewertet haben. Wenn jedoch nur weniger als oder genau k Nutzer:innen ein Item bewertet haben, sind alle Bewertungen gleich „ähnlich“.
In dieser Übung zählst du, wie oft jeder Film im DataFrame user_ratings_df bewertet wurde, und prüfst anschließend, wie viele nur eine oder zwei Bewertungen haben.
Diese Übung ist Teil des Kurses
Recommendation Engines mit Python entwickeln
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Count the occupied cells per column
occupied_count = user_ratings_df.____().____()
print(occupied_count)