1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rによる次元削減

Connected

演習

特徴量重要度を使ってデータを縮約する

完全なランダムフォレストモデルを作成できたので、次は特徴量重要度を確認していきます。

ランダムフォレストは自然に(ただし暗黙的に)特徴量選択を行いますが、それでもモデルを縮約して構築すると有利なことが多いです。縮約モデルは学習が速く、予測計算も速く、理解・運用がしやすくなります。もちろん、モデルの単純さと性能の間には常にトレードオフがあります。

この演習では、データセットを縮約します。次の演習で、縮約モデルを当てはめ、完全モデルと性能を比較します。rf_fit、train、test は用意されています。

tidyverse、tidymodels、vip パッケージは読み込まれています。

指示

100 XP
  • vi() に rank 引数を指定して、最も重要な特徴量を10個抽出します。
  • 目的変数を上位特徴量リストに戻し入れます。
  • 上位特徴量のマスクを適用して、データセットを縮約します。