1. Учиться
  2. /
  3. Courses
  4. /
  5. Rで学ぶSupervised Learning:分類

Connected

Exercise

木が大きくなりすぎるのを防ぐ

応募者データの全体で学習した木は、非常に大きく複雑になり、分割が何百回も行われ、葉ノードにはごく少数の応募者しか含まれていませんでした。これでは、融資担当者が解釈するのはほぼ不可能です。

事前剪定(pre-pruning) による早期停止を使うと、木が過度に大きく複雑になるのを防げます。rpart の最大深さや最小分割数の制御オプションが、結果の木にどのように影響するかを確認しましょう。

rpart はすでに読み込まれています。

Инструкции 1 / 2

undefined XP
  • 1
    • rpart() を使って、訓練データセットと利用可能なすべての予測子からローンモデルを構築します。
      • モデルの control は rpart.control() を使い、cp を 0、maxdepth を 6 に設定します。
    • この単純なモデルのテストセット精度が、元の 58.3% とどう違うかを確認します。
      • まず predict() 関数で予測ベクトルを作成します。
      • 予測と実際の結果を比較し、mean() で精度を計算します。
  • 2

    モデルのコントロールで、maxdepth を削除し、最小分割パラメータ minsplit を 500 に設定して追加します。