1. Учиться
  2. /
  3. Courses
  4. /
  5. scikit-learn で学ぶ Supervised Learning

Connected

Exercise

回帰におけるセンタリングとスケーリング

スケーリングの効果を確認したところで、パイプラインを使って music_df の特徴量を前処理し、楽曲のラウドネスを予測する lasso 回帰モデルを構築します。

X_train、X_test、y_train、y_test は、music_df データセットから作成されています。目的変数は "loudness"、特徴量はそれ以外のすべての列です。Lasso と Pipeline もインポート済みです。

なお、"genre" は二値特徴量に変換されており、1 はロック、0 はその他のジャンルを表します。

Инструкции

100 XP
  • StandardScaler をインポートします。
  • パイプライン用のステップを作成します。"scaler" という名前の StandardScaler オブジェクトと、alpha を 0.5 に設定した "lasso" という名前の lasso モデルを用意します。
  • スケーリングと lasso 回帰モデルの構築を行うステップでパイプラインをインスタンス化します。
  • テストデータに対する決定係数(R-squared)を計算します。