1. Learn
  2. /
  3. Courses
  4. /
  5. Rによる次元削減

Connected

Exercise

lasso 回帰のためにデータをスケーリングする

lasso 回帰モデルを適合させる前準備として、すべての特徴量が互いに比較可能になるようにデータをスケーリングすることが重要です。King County, California の住宅販売データ全体は house_sales_df にあります。

この演習では、データを学習用とテスト用に分割する前に、目的変数 price を個別にスケーリングします。これは tidymodels の recipe の仕組みによるものです。recipe には目的変数の変換を含めません。

tidyverse と tidymodels パッケージはすでに読み込まれています。

Instructions

100 XP
  • house_sales_df の目的変数 price を scale() でスケーリングします。
  • 学習用データ 80%・テスト用データ 20% となるように分割します。
  • 学習用データを使って recipe を作成し、数値の説明変数をすべてスケーリングします。