1. Learn
  2. /
  3. 课程
  4. /
  5. Python 中的无监督学习

Connected

道练习

维基百科文章的 NMF 特征

现在,您将探索上一练习中创建的 NMF 特征。上一练习的解答已预加载,因此数组 nmf_features 可用。同时还提供了列表 titles,其中给出了每篇维基百科文章的标题。

在查看这些特征时请注意:对于两位演员,NMF 特征 3 的数值都远高于其他特征。这意味着这两篇文章主要由第 3 个 NMF 组件重构。下一段视频中您将看到原因:NMF 组件代表主题(例如表演)。

说明

100 XP
  • 将 pandas 以别名 pd 导入。
  • 使用 pd.DataFrame() 由 nmf_features 创建一个 DataFrame df,并通过 index=titles 将索引设为 titles。
  • 使用 df 的 .loc[] 访问器选择标题为 'Anne Hathaway' 的行,并打印结果。这些就是关于女演员 Anne Hathaway 的文章的 NMF 特征。
  • 对 'Denzel Washington'(另一位演员)重复上一步。