1. Apprendre
  2. /
  3. Cours
  4. /
  5. Unsupervised Learning in Python

Connected

Exercice

Quels articles sont similaires à « Cristiano Ronaldo » ?

Dans la vidéo, vous avez appris à utiliser les caractéristiques NMF et la similarité cosinus pour trouver des articles similaires. Appliquez cela à votre modèle NMF pour des articles populaires de Wikipédia en trouvant les articles les plus similaires à celui sur le footballeur Cristiano Ronaldo. Les caractéristiques NMF obtenues précédemment sont disponibles sous nmf_features, et titles est une liste des titres d'articles.

Instructions

100 XP
  • Importez normalize depuis sklearn.preprocessing.
  • Appliquez la fonction normalize() à nmf_features. Stockez le résultat dans norm_features.
  • Créez un DataFrame df à partir de norm_features, en utilisant titles comme index.
  • Utilisez l'accesseur .loc[] de df pour sélectionner la ligne de 'Cristiano Ronaldo'. Assignez le résultat à article.
  • Appliquez la méthode .dot() de df à article pour calculer la similarité cosinus de chaque ligne avec article.
  • Affichez le résultat de la méthode .nlargest() de similarities pour présenter les articles les plus similaires. Cela a été fait pour vous, alors cliquez sur « Soumettre la réponse » pour voir le résultat !