回帰のための中心化とスケーリング

データのスケーリングの効果を確認したところで、次はパイプラインを使って music_df の特徴量を前処理し、曲の音量を予測する Lasso 回帰モデルを構築しましょう。

X_train データセットから X_test、y_train、y_test、music_df が作成済みです。目的変数は "loudness" で、特徴量はデータセットの他のすべての列です。Lasso と Pipeline もインポート済みです。

なお、"genre" はバイナリ特徴量に変換されており、1 はロック曲、0 はその他のジャンルを表します。