1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶSupervised Learning:分類

Connected

演習

適切に剪定された木を作る

木が最後まで成長しないように止めると、データの一部を見落としたり、後で見つかったかもしれない重要な傾向を逃すおそれがあります。

事後剪定(post-pruning) を使うと、あえて大きく複雑な木を成長させてから、後でより小さく効率的な木に剪定できます。

この演習では、木の性能と複雑度の関係を可視化し、その情報を使って適切なレベルまで木を剪定します。

rpart パッケージは、loans_test と loans_train とともに、すでに読み込まれています。

指示

100 XP
  • すべての申請者変数を使い、事前剪定なしで過度に複雑な木を作成します。事前剪定を防ぐために、rpart.control() で必ず cp = 0 を設定してください。
  • モデルに対して plotcp() を使い、複雑度プロットを作成します。
  • 複雑度プロットに基づき、prune() 関数で木と複雑度パラメータを指定して、複雑度 0.0014 に剪定します。
  • 剪定後の木の正解率を、元の 58.3% と比較します。正解率の計算には predict() と mean() を使用します。