Normaliseer je gegevens
Voordat je met singular value decomposition de factoren van de beoordelingsmatrix kunt vinden, moet je de data "de-meannen", of centreren, door van elke waarde in een rij het gemiddelde van die rij af te trekken.
In deze oefening begin je met het voorbereiden van het filmbeoordelings-DataFrame waar je mee hebt gewerkt, zodat je Singular value decomposition kunt uitvoeren.
user_ratings_df bevat één rij per gebruiker en een kolom voor elke film, en is al voor je ingeladen.
Deze oefening maakt deel uit van de cursus
Aanbevelingssystemen bouwen in Python
Oefeninstructies
- Zoek de gemiddelde beoordeling die elke gebruiker heeft gegeven over alle films die hij/zij heeft gezien en sla deze waarden op als
avg_ratings. - Trek de rijgemiddelden af van hun respectieve rijen en sla het resultaat op als
user_ratings_centered. - Vul tot slot alle ontbrekende waarden in
user_ratings_centeredmet nullen. - Print het gemiddelde van elke kolom in
user_ratings_centeredom te laten zien dat ze zijn gede-meand.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Get the average rating for each user
avg_ratings = user_ratings_df.____(axis=1)
# Center each user's ratings around 0
user_ratings_centered = user_ratings_df.____(____, axis=1)
# Fill in all missing values with 0s
user_ratings_centered.____(0, inplace=True)
# Print the mean of each column
print(user_ratings_centered.____(axis=1))