1. Learn
  2. /
  3. 课程
  4. /
  5. Python 中的无监督学习

Connected

道练习

为聚类缩放鱼类数据

给定一个数组 samples,包含鱼类的测量数据。每一行代表一条鱼。各项测量(例如重量,单位为克;长度,单位为厘米;以及高度与长度的百分比)处于截然不同的量纲。为了更有效地对这些数据进行聚类,您需要先对这些特征进行标准化。在本练习中,您将构建一个流水线来完成标准化并对数据进行聚类。

这些鱼类测量数据来源于 Journal of Statistics Education。

说明

100 XP
  • 导入:
    • 从 sklearn.pipeline 导入 make_pipeline。
    • 从 sklearn.preprocessing 导入 StandardScaler。
    • 从 sklearn.cluster 导入 KMeans。
  • 创建一个名为 scaler 的 StandardScaler 实例。
  • 创建一个具有 4 个簇、名为 kmeans 的 KMeans 实例。
  • 创建一个名为 pipeline 的流水线,将 scaler 和 kmeans 串联起来。为此,只需将它们作为参数传递给 make_pipeline()。