1. 学ぶ
  2. /
  3. コース
  4. /
  5. scikit-learn で学ぶ Supervised Learning

Connected

演習

カテゴリ特徴量を用いた回帰

各曲のジャンルに対する二値特徴量を含む music_dummies を作成できたので、次はリッジ回帰モデルで曲の人気度を予測してみましょう。

music_dummies はすでに読み込まれており、Ridge、cross_val_score、numpy(np として)、そして KFold オブジェクト(kf として保存)も用意されています。

モデルは平均 RMSE を計算して評価します。ただしその前に、各分割で得られたスコアを正の値に変換し、平方根を取る必要があります。この指標はモデルの予測誤差の平均を表し、目的変数("popularity")の標準偏差と比較できます。

指示

100 XP
  • music_dummies のすべての特徴量を含む X と、"popularity" 列からなる y をそれぞれ作成します。
  • alpha を 0.2 に設定してリッジ回帰モデルをインスタンス化します。
  • リッジモデルを用いて X と y に対して交差検証を実行し、cv を kf に設定し、評価指標には負の平均二乗誤差を使用します。
  • 負の scores を正に変換して平方根を取り、RMSE の値を出力してください。