1. Učit se
  2. /
  3. Kurzy
  4. /
  5. 使用 scikit-learn 的监督学习

Connected

cvičení

包含类别特征的回归

现在,您已经创建了 music_dummies,其中为每首歌的流派生成了二元特征,是时候构建一个岭回归模型来预测歌曲的受欢迎度了。

music_dummies 已为您预加载,同时还包含 Ridge、cross_val_score、以 np 导入的 numpy,以及存储为 kf 的 KFold 对象。

我们将通过计算平均 RMSE 来评估模型。不过在此之前,您需要把每个折的得分转换为正值并取平方根。该指标表示模型预测的平均误差,因此可以与目标值 "popularity" 的标准差进行比较。

Pokyny

100 XP
  • 分别创建 X(包含 music_dummies 中的所有特征)和 y(仅包含 "popularity" 列)。
  • 实例化一个岭回归模型,将 alpha 设为 0.2。
  • 使用该岭回归模型在 X 和 y 上执行交叉验证,将 cv 设为 kf,并使用负均方误差作为评分指标。
  • 通过将负的 scores 转为正值并取平方根来打印 RMSE。