Poucos dados nas suas linhas
Essa escassez de dados pode causar problemas ao usar técnicas como K-nearest neighbors, como discutido no capítulo anterior. KNN precisa encontrar os k usuários mais semelhantes que avaliaram um item, mas, se apenas k usuários ou menos tiverem dado uma avaliação ao item, todas as avaliações serão as “mais semelhantes”.
Neste exercício, você vai contar quantas vezes cada filme no DataFrame user_ratings_df recebeu uma avaliação e, em seguida, ver quantos têm apenas uma ou duas avaliações.
Este exercício faz parte do curso
Construindo mecanismos de recomendação em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Count the occupied cells per column
occupied_count = user_ratings_df.____().____()
print(occupied_count)