1. 学ぶ
  2. /
  3. コース
  4. /
  5. R で学ぶクレジットリスク・モデリング

Connected

演習

AUC に基づくもう一段の剪定

動画では、ロジットリンクを用いた「フル」ロジスティック回帰モデルを、AUC に基づいて剪定していく様子を見ました。AUC が向上したため、home_ownership をモデルから削除しました。さらに同様の手順を2回繰り返し、age と ir_cat を削除した結果、次のモデルになりました。

log_3_remove_ir <- glm(loan_status ~ loan_amnt + grade + annual_inc + emp_cat, family = binomial, data = training_set)

このときの AUC は 0.6545 でした。ここからは、さらに別の変数を削除して AUC を改善できるかを確かめてみましょう。

指示

100 XP
  • モデル log_3_remove_ir から一度に1変数ずつ削除してください。リンク関数はデフォルト(logit)を使います。
  • 作成した各モデルについて、デフォルト確率の予測を行います。
  • 各モデルの AUC を得るために、auc() を使います。第1引数は test_set$loan_status、第2引数は4つの各モデルの予測結果にします。
  • 最も高い AUC を示したモデルを表すオブジェクト名(この演習の最初の設問で指定した名前のとおり)をコピーして提出してください。