LoslegenKostenlos loslegen

Begrenzte Daten in deinen Zeilen

Diese Datensparsamkeit kann bei Techniken wie K-nearest neighbors, wie im letzten Kapitel besprochen, zu Problemen führen. KNN muss die k ähnlichsten Nutzer:innen finden, die ein Item bewertet haben. Wenn jedoch nur weniger als oder genau k Nutzer:innen ein Item bewertet haben, sind alle Bewertungen gleich „ähnlich“.

In dieser Übung zählst du, wie oft jeder Film im DataFrame user_ratings_df bewertet wurde, und prüfst anschließend, wie viele nur eine oder zwei Bewertungen haben.

Diese Übung ist Teil des Kurses

Recommendation Engines mit Python entwickeln

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Count the occupied cells per column
occupied_count = user_ratings_df.____().____()
print(occupied_count)
Code bearbeiten und ausführen