1. Nauka
  2. /
  3. Kursy
  4. /
  5. Python 中的无监督学习

Connected

ćwiczenie

对鱼类数据进行聚类

现在,您将使用上一个练习中的标准化与聚类管道,根据测量值对鱼类进行聚类,并创建一个列联表来比较聚类标签与鱼类物种。

与之前一样,samples 是包含鱼类测量值的 2D 数组。您的管道为 pipeline,每个鱼类样本的物种由列表 species 给出。

Instrukcje

100 XP
  • 将 pandas 以 pd 的别名导入。
  • 将管道拟合到鱼类测量值 samples(使用 .fit())。
  • 使用 pipeline 的 .predict() 方法为 samples 获取聚类标签。
  • 使用 pd.DataFrame() 创建名为 df 的 DataFrame,包含 'labels' 和 'species' 两列,列值分别来自 labels 和 species。
  • 使用 pd.crosstab() 基于 df['labels'] 和 df['species'] 创建列联表 ct。