LoslegenKostenlos starten

Begrenzte Daten in deinen Zeilen

Diese Datensparsamkeit kann bei Techniken wie K-nearest neighbors, wie im letzten Kapitel besprochen, zu Problemen führen. KNN muss die k ähnlichsten Nutzer:innen finden, die ein Item bewertet haben. Wenn jedoch nur weniger als oder genau k Nutzer:innen ein Item bewertet haben, sind alle Bewertungen gleich „ähnlich“.

In dieser Übung zählst du, wie oft jeder Film im DataFrame user_ratings_df bewertet wurde, und prüfst anschließend, wie viele nur eine oder zwei Bewertungen haben.

Diese Übung ist Teil des Kurses

<Kurs>Recommendation Engines mit Python entwickeln</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Count the occupied cells per column
occupied_count = user_ratings_df.____().____()
print(occupied_count)
Code bearbeiten und ausführen