1. 学ぶ
  2. /
  3. コース
  4. /
  5. R で学ぶクレジットリスク・モデリング

Connected

演習

最後に、さらに多くのオプションを使った木

この演習では、動画で取り上げた最後のいくつかの引数を使います。rpart.control() 関数でいくつかの指定を変更し、rpart() の weights 引数を使って重みを加えます。ベクター case_weights はあらかじめ作成済みで、ワークスペースに読み込まれています。このベクターには、学習データ内の非デフォルトに重み1、デフォルトに重み3が設定されています。デフォルトに高い重みを与えることで、モデルはデフォルトを正しく分類することをより重視するようになります。

指示

100 XP
  • 乱数シードを345に設定します。
  • 提供されたコードに、rpart() の weights 引数へ case_weights を渡す処理を追加します。
  • rpart.control の引数 minsplit と minbucket を使って、ノードで許可される最小分割数を5、リーフノードで許可される観測数の最小値を2に変更します。
  • plotcp() 関数を使って、交差検証誤差率が最小になる位置を確認します。
  • which.min() を使って、tree_weights$cp 内で "xerror" が最小の行を特定し、これを index に代入します。
  • 提供されたコードを使って、交差検証誤差が最小となる cp を選択します。
  • 交差検証誤差率が最小となる複雑度パラメータで木を剪定し、剪定後の木を ptree_weights に保存します。
  • prp() 関数で剪定後の木をプロットします。第2引数 extra を含め、1 に設定してください。