1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ教師なし学習

Connected

演習

Wikipedia 記事の NMF 特徴量

前の演習で作成した NMF 特徴量を調べてみましょう。前の演習の解答は読み込まれており、配列 nmf_features が利用可能です。また、各 Wikipedia 記事のタイトルを表すリスト titles も利用できます。

特徴量を確認すると、両方の俳優について NMF 特徴量 3 の値が他と比べて突出して高いことに気づきます。これは、どちらの記事も主に 3 番目の NMF コンポーネントで再構成されていることを意味します。次の動画で理由を見ていきますが、NMF のコンポーネントはトピック(たとえば演技など)を表すのです。

指示

100 XP
  • pandas を pd としてインポートします。
  • pd.DataFrame() を使って nmf_features から DataFrame df を作成します。index=titles でインデックスを titles に設定します。
  • df の .loc[] アクセサを使って、タイトルが 'Anne Hathaway' の行を選択し、結果を出力します。これは女優 Anne Hathaway に関する記事の NMF 特徴量です。
  • 同様に 'Denzel Washington'(別の俳優)についても実行します。