Begrenzte Daten in deinen Zeilen
Diese Datensparsamkeit kann bei Techniken wie K-nearest neighbors, wie im letzten Kapitel besprochen, zu Problemen führen. KNN muss die k ähnlichsten Nutzer:innen finden, die ein Item bewertet haben. Wenn jedoch nur weniger als oder genau k Nutzer:innen ein Item bewertet haben, sind alle Bewertungen gleich „ähnlich“.
In dieser Übung zählst du, wie oft jeder Film im DataFrame user_ratings_df bewertet wurde, und prüfst anschließend, wie viele nur eine oder zwei Bewertungen haben.
Diese Übung ist Teil des Kurses
<Kurs>Recommendation Engines mit Python entwickeln</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Count the occupied cells per column
occupied_count = user_ratings_df.____().____()
print(occupied_count)