1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 scikit-learn 的监督学习

Connected

道练习

用于歌曲流派预测的流水线:I

现在是构建流水线的时候了。它将包含以下步骤:用每个特征的均值来填补缺失值,并构建一个 KNN 模型来进行歌曲流派的分类。

上一个练习中您创建的修改版 music_df 数据集已为您预加载,同时还预加载了 KNeighborsClassifier 和 train_test_split。

说明

100 XP
  • 导入 SimpleImputer 和 Pipeline。
  • 实例化一个缺失值填补器。
  • 实例化一个具有 3 个邻居的 KNN 分类器。
  • 创建 steps,这是一个元组列表,依次包含您创建的名为 "imputer" 的填补器变量,以及您创建的名为 "knn" 的 knn 模型。