1. 学ぶ
  2. /
  3. コース
  4. /
  5. scikit-learn で学ぶ Supervised Learning

Connected

演習

特徴量の作成

この章では、sales_df というデータセットを扱います。これは、媒体別の広告キャンペーン費用と、そのキャンペーンで生み出された売上金額(ドル)の情報を含んでいます。データセットはすでに読み込まれています。最初の2行は次のとおりです。

     tv        radio      social_media    sales
1    13000.0   9237.76    2409.57         46677.90
2    41000.0   15886.45   2913.41         150177.83

広告費を特徴量として用い、売上を予測します。最初は "radio" 列から始めます。ただし、予測を行う前に、scikit-learn に適した形式になるよう、特徴量配列と目的変数配列を作成し、必要に応じて形状を変換する必要があります。

指示

100 XP
  • sales_df DataFrame の "radio" 列の値から配列 X を作成します。
  • sales_df DataFrame の "sales" 列の値から配列 y を作成します。
  • X を2次元の NumPy 配列にリシェイプします。
  • X と y の shape を出力します。