1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶSupervised Learning:分類

Connected

演習

過度に大きくなる木を防ぐ

申請者データの全セットで育てた木は、非常に大きく複雑になり、分割が何百回も行われ、各リーフノードにはごく少数の申請者しか含まれていませんでした。これでは融資担当者が解釈するのはほぼ不可能です。

早期終了のための事前剪定(pre-pruning)を使うと、木が過度に大きく複雑になるのを防げます。rpart の制御オプションである最大深さと最小分割数が、最終的な木にどう影響するかを確認しましょう。

loans_train と loans_test のデータセットは作成済みで、rpart は読み込み済みです。

指示1 / 2

undefined XP
  • 1
    • rpart() を使って、学習用データセットと利用可能なすべての予測子で融資モデルを構築しましょう。
      • モデルの control は rpart.control() を使い、cp を 0、maxdepth を 6 に設定します。
    • この単純なモデルのテストセット精度が、元の 58.3% の精度とどう違うかを確認しましょう。
      • まず predict() 関数を使って予測のベクトルを作成します。
      • 予測と実際の結果を比較し、mean() を使って精度を計算します。
  • 2

    モデルの制御では、maxdepth を削除し、最小分割パラメータ minsplit を 500 に設定して追加しましょう。