Aan de slagGa gratis aan de slag

Normaliseer je gegevens

Voordat je met singular value decomposition de factoren van de beoordelingsmatrix kunt vinden, moet je de data "de-meannen", of centreren, door van elke waarde in een rij het gemiddelde van die rij af te trekken.

In deze oefening begin je met het voorbereiden van het filmbeoordelings-DataFrame waar je mee hebt gewerkt, zodat je Singular value decomposition kunt uitvoeren.

user_ratings_df bevat één rij per gebruiker en een kolom voor elke film, en is al voor je ingeladen.

Deze oefening maakt deel uit van de cursus

Aanbevelingssystemen bouwen in Python

Cursus bekijken

Oefeninstructies

  • Zoek de gemiddelde beoordeling die elke gebruiker heeft gegeven over alle films die hij/zij heeft gezien en sla deze waarden op als avg_ratings.
  • Trek de rijgemiddelden af van hun respectieve rijen en sla het resultaat op als user_ratings_centered.
  • Vul tot slot alle ontbrekende waarden in user_ratings_centered met nullen.
  • Print het gemiddelde van elke kolom in user_ratings_centered om te laten zien dat ze zijn gede-meand.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Get the average rating for each user 
avg_ratings = user_ratings_df.____(axis=1)

# Center each user's ratings around 0
user_ratings_centered = user_ratings_df.____(____, axis=1)

# Fill in all missing values with 0s
user_ratings_centered.____(0, inplace=True)

# Print the mean of each column
print(user_ratings_centered.____(axis=1))
Code bewerken en uitvoeren