1. Learn
  2. /
  3. Courses
  4. /
  5. scikit-learn による教師あり学習

Connected

Exercise

カテゴリ変数を使った回帰

各楽曲のジャンルを表すバイナリ特徴量が含まれているmusic_dummies の作成が完了しました。次は、楽曲の人気度を予測するリッジ回帰モデルを構築しましょう。

music_dummies はあらかじめ読み込まれており、Ridge、cross_val_score、numpy(np として)、および KFold オブジェクト(kf として格納)も利用できます。

モデルの評価には平均 RMSE を使用します。まず、各分割のスコアを正の値に変換し、平方根を取る必要があります。この指標はモデルの予測誤差の平均を示し、目的変数—"popularity"—の標準偏差と比較することができます。

Instructions

100 XP
  • X のすべての特徴量を含む music_dummies と、y 列からなる "popularity" をそれぞれ作成します。
  • alpha を 0.2 に設定して、リッジ回帰モデルをインスタンス化します。
  • リッジモデルを使って X と y に交差検証を実行します。cv を kf に設定し、スコアリング指標として負の平均二乗誤差を使用してください。
  • 負の値の scores を正の値に変換し、平方根を取って絵RMSE の値を出力します。