Normalize seus dados
Antes de encontrar os fatores da matriz de avaliações usando a decomposição em valores singulares, você precisa "remover a média" (ou centralizar) subtraindo a média de cada linha de cada valor nessa linha.
Neste exercício, você vai começar a preparar o DataFrame de avaliações de filmes com o qual vem trabalhando para poder realizar a decomposição em valores singulares.
user_ratings_df contém uma linha por usuário e uma coluna para cada filme e já foi carregado para você.
Este exercício faz parte do curso
Construindo mecanismos de recomendação em Python
Instruções do exercício
- Encontre a avaliação média que cada usuário deu em todos os filmes que viu e armazene esses valores em
avg_ratings. - Subtraia as médias das linhas de suas respectivas linhas e armazene o resultado em
user_ratings_centered. - Por fim, preencha todos os valores ausentes em
user_ratings_centeredcom zeros. - Imprima a média de cada coluna em
user_ratings_centeredpara mostrar que os dados foram centralizados (removida a média).
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Get the average rating for each user
avg_ratings = user_ratings_df.____(axis=1)
# Center each user's ratings around 0
user_ratings_centered = user_ratings_df.____(____, axis=1)
# Fill in all missing values with 0s
user_ratings_centered.____(0, inplace=True)
# Print the mean of each column
print(user_ratings_centered.____(axis=1))