1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 scikit-learn 的监督学习

Connected

道练习

创建特征

在本章中,您将使用名为 sales_df 的数据集,其中包含不同媒介类型的广告投放支出,以及相应活动带来的销售额(美元)。数据集已为您预加载。前两行如下所示:

     tv        radio      social_media    sales
1    13000.0   9237.76    2409.57         46677.90
2    41000.0   15886.45   2913.41         150177.83

您将使用广告投放支出作为特征来预测销售额,首先从 "radio" 列开始。不过,在进行预测之前,您需要先创建特征数组和目标数组,并将它们调整为适用于 scikit-learn 的正确形状。

说明

100 XP
  • 创建 X,其值来自 sales_df DataFrame 的 "radio" 列。
  • 创建 y,其值来自 sales_df DataFrame 的 "sales" 列。
  • 将 X 调整为二维 NumPy 数组。
  • 打印 X 和 y 的形状。