LoslegenKostenlos loslegen

Normalisiere deine Daten

Bevor du die Faktoren der Bewertungsmatrix mit der Singulärwertzerlegung bestimmst, musst du sie „entmitteln“, also zentrieren, indem du von jedem Wert einer Zeile den Mittelwert dieser Zeile abziehst.

In dieser Übung beginnst du damit, das DataFrame mit den Filmbewertungen vorzubereiten, mit dem du gearbeitet hast, damit du anschließend die Singulärwertzerlegung durchführen kannst.

user_ratings_df enthält eine Zeile pro Nutzer und eine Spalte pro Film und wurde bereits für dich geladen.

Diese Übung ist Teil des Kurses

Recommendation Engines mit Python entwickeln

Kurs anzeigen

Anleitung zur Übung

  • Ermittle die durchschnittliche Bewertung, die jeder Nutzer über alle gesehenen Filme vergeben hat, und speichere diese Werte als avg_ratings.
  • Subtrahiere die Zeilenmittelwerte von ihren jeweiligen Zeilen und speichere das Ergebnis als user_ratings_centered.
  • Fülle anschließend alle fehlenden Werte in user_ratings_centered mit Nullen.
  • Gib den Durchschnitt jeder Spalte in user_ratings_centered aus, um zu zeigen, dass sie entmittelt wurden.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Get the average rating for each user 
avg_ratings = user_ratings_df.____(axis=1)

# Center each user's ratings around 0
user_ratings_centered = user_ratings_df.____(____, axis=1)

# Fill in all missing values with 0s
user_ratings_centered.____(0, inplace=True)

# Print the mean of each column
print(user_ratings_centered.____(axis=1))
Code bearbeiten und ausführen