1. 学ぶ
  2. /
  3. コース
  4. /
  5. R で学ぶクレジットリスク・モデリング

Connected

演習

より判別力の高いモデルを作る

前の演習では、延滞確率の予測レンジがかなり小さかったですね。既に説明したとおり、延滞率が低い場合には小さな予測確率になるのは普通ですが、より大きなモデル(つまり、より多くの予測変数を含めること)を作ると、予測のレンジを広げられます。

これで最終的に予測が「良く」なるかどうかは、追加した予測変数の質に左右され、検証が必要です。まずは、モデルを大きくするとレンジがどのように広がるかを確認してみましょう。

指示

100 XP
  • log_model_small を作ったときと同様に log_model_full を作成しますが、今回はデータセット内の利用可能なすべての予測変数を含めてください。各列名を個別に入力したくない場合は、loan_status ~ . としてすべての変数を一括で指定できます。
  • テストセット内のすべてのケースに対して、predict() を使って予測ベクトル predictions_all_full を作成します。これらの値は延滞の確率を表している点に注意してください。
  • 予測値のレンジを確認してください。