1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ教師なし学習

Connected

演習

'Cristiano Ronaldo' に似ている記事はどれですか?

この動画では、NMF の特徴量とコサイン類似度を使って、類似する記事を見つける方法を学びました。 これを人気の Wikipedia 記事に対する NMF モデルに適用し、サッカー選手 Cristiano Ronaldo に関する記事に最も似ている記事を見つけてください。以前に作成した NMF の特徴量は nmf_features に、記事タイトルのリストは titles に用意されています。

指示

100 XP
  • sklearn.preprocessing から normalize をインポートします。
  • normalize() 関数を nmf_features に適用し、結果を norm_features として保存します。
  • titles をインデックスとして使い、norm_features から DataFrame df を作成します。
  • df の .loc[] アクセサを使って、'Cristiano Ronaldo' の行を選択し、結果を article に代入します。
  • df の .dot() メソッドを article に適用して、各行と article とのコサイン類似度を計算します。
  • 最も類似した記事を表示するために、similarities の .nlargest() の結果を出力します。これはすでに用意されているので、"Submit Answer" を押して結果を確認しましょう!