ComeçarComece de graça

Compensando dados incompletos

Na maioria dos conjuntos de dados, a maior parte dos usuários terá avaliado apenas um pequeno número de itens. Como você viu no último exercício, a forma como lida com usuários que não têm avaliações para um item pode influenciar muito a validade dos seus modelos.

Neste exercício, você vai preencher os dados ausentes com informações que não devem enviesar os dados que você já tem.

Você vai calcular a nota média que cada usuário deu em todas as suas avaliações e, em seguida, usar essa média para centralizar as notas dos usuários em torno de zero. Por fim, você poderá preencher os valores vazios com zeros, que agora representam uma pontuação neutra, minimizando o impacto no perfil geral deles, mas ainda permitindo comparar usuários.

user_ratings_table, com uma linha por usuário, já foi carregada para você.

Este exercício faz parte do curso

Construindo mecanismos de recomendação em Python

Ver curso

Instruções do exercício

  • Encontre a média das avaliações dadas por cada usuário em user_ratings_table e armazene como avg_ratings.
  • Subtraia as médias das linhas de cada linha em user_ratings_table e armazene como user_ratings_table_centered.
  • Preencha os valores vazios no novo user_ratings_table_centered com zeros.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Get the average rating for each user 
avg_ratings = user_ratings_table.____(axis=____)

# Center each users ratings around 0
user_ratings_table_centered = user_ratings_table.____(____, axis=0)

# Fill in the missing data with 0s
user_ratings_table_normed = user_ratings_table_centered.____(____)
Editar e executar o código