Peu de données dans vos lignes
Cette rareté des données peut poser problème avec des techniques comme les K plus proches voisins, comme évoqué au chapitre précédent. KNN doit trouver les k utilisateurs les plus similaires qui ont noté un article, mais si seulement k utilisateurs ou moins ont attribué une note à un article, toutes ces notes seront considérées comme les « plus similaires ».
Dans cet exercice, vous allez compter combien de fois chaque film du DataFrame user_ratings_df a reçu une note, puis voir combien n’ont qu’une ou deux notes.
Cet exercice fait partie du cours
<cours>Créer des moteurs de recommandation en Python</cours>Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Count the occupied cells per column
occupied_count = user_ratings_df.____().____()
print(occupied_count)