1. Learn
  2. /
  3. Courses
  4. /
  5. Rで学ぶSupervised Learning:分類

Connected

Exercise

より大きな木の構築と評価

これまでに、申請者のクレジットスコアと希望借入額を使って、ローン結果を予測するシンプルな決定木を作成しました。

Lending Club には、持ち家の有無、勤続年数、借入目的、過去の破産歴など、より正確な予測に役立ちそうな追加情報があります。

利用可能な申請者データをすべて用いて、以前に作成したランダムな訓練データセットから、より高度な貸出モデルを構築しましょう。次に、このモデルをテストデータセットに適用して予測を行い、今後のローン申請に対するモデル性能を見積もってください。

rpart パッケージはあらかじめ読み込まれており、loans_train と loans_test の各データセットも用意されています。

Instructions

100 XP
  • 訓練データセットと利用可能なすべての説明変数を使って、rpart() でローンモデルを構築します。今回も control 引数は変更しないでください。
  • テストデータセットに predict() 関数を適用して、予測された結果のベクトルを作成します。type 引数を忘れないでください。
  • 予測値と実際の outcome を比較するために、table() を作成します。
  • mean() 関数を使って、予測の正解率を計算します。