1. Learn
  2. /
  3. คอร์ส
  4. /
  5. Python 中的无监督学习

Connected

แบบฝึกหัด

提取聚类标签

在上一个练习中,您看到高度为 6 时谷物样本的中间聚类有 3 个簇。现在,请使用 fcluster() 提取该中间聚类的标签,并使用交叉列联表将这些标签与谷物品种进行比较。

层次聚类已完成,mergings 是 linkage() 函数的结果。列表 varieties 给出了每个谷物样本的品种。

คำแนะนำ

100 XP
  • 导入:
    • 将 pandas 导入为 pd。
    • 从 scipy.cluster.hierarchy 导入 fcluster。
  • 对 mergings 使用 fcluster() 执行平坦的层次聚类。指定最大高度为 6,并使用关键字参数 criterion='distance'。
  • 创建一个名为 df 的 DataFrame,包含 'labels' 和 'varieties' 两列,分别使用 labels 和 varieties 作为列值。此步骤已为您完成。
  • 创建 df['labels'] 与 df['varieties'] 之间的交叉列联表 ct,以统计每种谷物品种在各个聚类标签中的出现次数。