1. 学ぶ
  2. /
  3. コース
  4. /
  5. scikit-learn による教師あり学習

Connected

演習

回帰のための中心化とスケーリング

データのスケーリングの効果を確認したところで、次はパイプラインを使って music_df の特徴量を前処理し、曲の音量を予測する Lasso 回帰モデルを構築しましょう。

X_train データセットから X_test、y_train、y_test、music_df が作成済みです。目的変数は "loudness" で、特徴量はデータセットの他のすべての列です。Lasso と Pipeline もインポート済みです。

なお、"genre" はバイナリ特徴量に変換されており、1 はロック曲、0 はその他のジャンルを表します。

指示

100 XP
  • StandardScaler をインポートします。
  • パイプラインオブジェクト用のステップを作成します。StandardScaler という名前の "scaler" オブジェクトと、"lasso" を alpha に設定した 0.5 という名前の Lasso モデルを用意します。
  • スケーリングと Lasso 回帰モデルの構築を行うステップを持つパイプラインをインスタンス化します。
  • テストデータで決定係数を計算します。