1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶTree-Based ModelsによるMachine Learning

Connected

演習

変数の重要度

バギング木は、決定木の分散の大きさという問題を克服するアンサンブルモデルであることは、すでにご存じですね。さらにランダムフォレストでは、各木で特徴量のランダムなサブセットだけを使うことで、これを改良します。これによりアンサンブル間の相関がさらに下がり、予測性能が向上します。

この演習では、ランダムフォレストを自分で構築し、vip パッケージを使って予測変数の重要度を可視化します。学習用データ customers_train はワークスペースに読み込まれています。

指示

100 XP
  • "ranger" エンジンと "impurity" 型の変数重要度を用いるランダムフォレスト分類モデルの仕様 spec を作成します。
  • ティブル customers_train に対して、目的変数を still_customer、それ以外の列を説明変数として、spec を当てはめて model を作成します。
  • 変数重要度を、(事前読み込みされていない)vip パッケージの vip() 関数でプロットします。