1. Nauka
  2. /
  3. Kursy
  4. /
  5. Python 中的无监督学习

Connected

ćwiczenie

与 "Cristiano Ronaldo" 相似的文章有哪些?

在视频中,您学习了如何使用 NMF 特征和余弦相似度来查找相似的文章。 请将其应用到您针对热门 Wikipedia 文章训练的 NMF 模型上,找出与足球运动员 Cristiano Ronaldo 相关文章最相似的文章。您先前获得的 NMF 特征存放在 nmf_features 中,titles 是文章标题列表。

Instrukcje

100 XP
  • 从 sklearn.preprocessing 导入 normalize。
  • 对 nmf_features 调用 normalize() 函数,并将结果存为 norm_features。
  • 使用 titles 作为索引,由 norm_features 创建一个 DataFrame df。
  • 使用 df 的 .loc[] 访问器选择 'Cristiano Ronaldo' 这一行。将结果赋给 article。
  • 对 df 调用 .dot() 方法,并以 article 为参数,计算每一行与 article 的余弦相似度。
  • 打印 similarities 的 .nlargest() 方法结果以显示最相似的文章。此步骤已为您完成,点击 "Submit Answer" 查看结果!