Normalisiere deine Daten
Bevor du die Faktoren der Bewertungsmatrix mit der Singulärwertzerlegung bestimmst, musst du sie „entmitteln“, also zentrieren, indem du von jedem Wert einer Zeile den Mittelwert dieser Zeile abziehst.
In dieser Übung beginnst du damit, das DataFrame mit den Filmbewertungen vorzubereiten, mit dem du gearbeitet hast, damit du anschließend die Singulärwertzerlegung durchführen kannst.
user_ratings_df enthält eine Zeile pro Nutzer und eine Spalte pro Film und wurde bereits für dich geladen.
Diese Übung ist Teil des Kurses
Recommendation Engines mit Python entwickeln
Anleitung zur Übung
- Ermittle die durchschnittliche Bewertung, die jeder Nutzer über alle gesehenen Filme vergeben hat, und speichere diese Werte als
avg_ratings. - Subtrahiere die Zeilenmittelwerte von ihren jeweiligen Zeilen und speichere das Ergebnis als
user_ratings_centered. - Fülle anschließend alle fehlenden Werte in
user_ratings_centeredmit Nullen. - Gib den Durchschnitt jeder Spalte in
user_ratings_centeredaus, um zu zeigen, dass sie entmittelt wurden.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Get the average rating for each user
avg_ratings = user_ratings_df.____(axis=1)
# Center each user's ratings around 0
user_ratings_centered = user_ratings_df.____(____, axis=1)
# Fill in all missing values with 0s
user_ratings_centered.____(0, inplace=True)
# Print the mean of each column
print(user_ratings_centered.____(axis=1))