Peu de données dans vos lignes
Cette rareté des données peut poser problème avec des techniques comme les K plus proches voisins, comme évoqué au chapitre précédent. KNN doit trouver les k utilisateurs les plus similaires qui ont noté un article, mais si seulement k utilisateurs ou moins ont attribué une note à un article, toutes ces notes seront considérées comme les « plus similaires ».
Dans cet exercice, vous allez compter combien de fois chaque film du DataFrame user_ratings_df a reçu une note, puis voir combien n’ont qu’une ou deux notes.
Cet exercice fait partie du cours
Créer des moteurs de recommandation en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Count the occupied cells per column
occupied_count = user_ratings_df.____().____()
print(occupied_count)