CommencerCommencer gratuitement

Peu de données dans vos lignes

Cette rareté des données peut poser problème avec des techniques comme les K plus proches voisins, comme évoqué au chapitre précédent. KNN doit trouver les k utilisateurs les plus similaires qui ont noté un article, mais si seulement k utilisateurs ou moins ont attribué une note à un article, toutes ces notes seront considérées comme les « plus similaires ».

Dans cet exercice, vous allez compter combien de fois chaque film du DataFrame user_ratings_df a reçu une note, puis voir combien n’ont qu’une ou deux notes.

Cet exercice fait partie du cours

Créer des moteurs de recommandation en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Count the occupied cells per column
occupied_count = user_ratings_df.____().____()
print(occupied_count)
Modifier et exécuter le code