ComeçarComece de graça

Normalize seus dados

Antes de encontrar os fatores da matriz de avaliações usando a decomposição em valores singulares, você precisa "remover a média" (ou centralizar) subtraindo a média de cada linha de cada valor nessa linha.

Neste exercício, você vai começar a preparar o DataFrame de avaliações de filmes com o qual vem trabalhando para poder realizar a decomposição em valores singulares.

user_ratings_df contém uma linha por usuário e uma coluna para cada filme e já foi carregado para você.

Este exercício faz parte do curso

Construindo mecanismos de recomendação em Python

Ver curso

Instruções do exercício

  • Encontre a avaliação média que cada usuário deu em todos os filmes que viu e armazene esses valores em avg_ratings.
  • Subtraia as médias das linhas de suas respectivas linhas e armazene o resultado em user_ratings_centered.
  • Por fim, preencha todos os valores ausentes em user_ratings_centered com zeros.
  • Imprima a média de cada coluna em user_ratings_centered para mostrar que os dados foram centralizados (removida a média).

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Get the average rating for each user 
avg_ratings = user_ratings_df.____(axis=1)

# Center each user's ratings around 0
user_ratings_centered = user_ratings_df.____(____, axis=1)

# Fill in all missing values with 0s
user_ratings_centered.____(0, inplace=True)

# Print the mean of each column
print(user_ratings_centered.____(axis=1))
Editar e executar o código