1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 scikit-learn 的监督学习

Connected

道练习

用于回归的居中与缩放

现在您已经了解了对数据进行缩放的好处,您将使用 pipeline 来预处理 music_df 的特征,并构建一个 lasso 回归模型来预测歌曲的响度。

X_train、X_test、y_train 和 y_test 已根据 music_df 数据集创建,其中目标为 "loudness",特征为数据集中的其他所有列。Lasso 和 Pipeline 也已为您导入。

请注意,"genre" 已被转换为二元特征,其中 1 表示摇滚歌曲,0 表示其他流派。

说明

100 XP
  • 导入 StandardScaler。
  • 为 pipeline 对象创建步骤:一个名为 "scaler" 的 StandardScaler 对象,以及一个名为 "lasso"、alpha 设为 0.5 的 lasso 模型。
  • 实例化一个包含缩放与构建 lasso 回归模型步骤的 pipeline。
  • 在测试数据上计算 R-squared 值。