1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rによる次元削減

Connected

演習

高相関のレシピを作成する

高い相関のある特徴量を見つけたら、手動で削除する代わりに、tidymodels のレシピステップ step_corr() を使えます。step_corr() は他の特徴量と相関するすべての特徴量を削除するわけではなく、可能な限り少ない数の特徴量を削除しようとします。概念的には、選択式の演習で見たように、他の特徴量のどの組み合わせとも最も重なりが大きい特徴量を削除します。つまり、他の特徴量が同じ情報を含んでいるため、削除された特徴量の重複する情報は他の特徴量で表現され続ける、という考え方です。

tidyverse と tidymodels パッケージは読み込まれています。

指示

100 XP
  • 数値の予測子にのみ適用し、しきい値を 0.7 に設定した step_corr() を使うレシピを作成します。
  • そのレシピを house_sales_df に適用し、フィルタ後のデータを filtered_house_sales_df に保存します。
  • tidy() を使って、step_corr() フィルターによって削除された列を特定します。