1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ特徴量エンジニアリング

Connected

演習

変数重要度を見極める

attrition データセットには、"Attrition" に関する 839 観測と 30 個の予測変数が含まれています。利用可能なすべての予測変数を使うモデルと、情報量の多い少数の変数に基づく縮小モデルとの性能トレードオフを調べたいと考えています。

この演習では、まずモデルを学習し、そのモデルの変数重要度を確認します。次の演習では、このモデルと縮小モデルを比較して、モデル性能を評価します。

環境には、train と test の分割、vip() パッケージ、そして事前に定義されたロジスティック回帰の model が用意されています。

指示

100 XP
  • すべての予測変数を用いて Attrition をモデル化するレシピを作成します。
  • ワークフローを訓練データに当てはめます。
  • fit_full オブジェクトを使って、モデルの変数重要度を可視化します。
  • vip() の前に extract_fit_parsnip() 関数を適用し、必要な情報を渡します。