1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶクレジットリスクモデリング

Connected

演習

勾配ブースティングによるポートフォリオのパフォーマンス

ここまでで、LogisticRegression() と XGBClassifier() の両方を使って延滞確率(probability of default)を予測しました。スコアリングや予測のサンプルも確認しましたが、ポートフォリオ全体のパフォーマンスにはどのように影響するのでしょうか? モデルを変えて検証する重要性を、期待損失(expected loss)を用いたシナリオで示してみましょう。

portfolio というデータフレームには、両モデルの延滞確率、デフォルト時損失率(いまは20%と仮定)、そしてデフォルト時エクスポージャとして扱う loan_amnt がまとめられています。

ワークスペースには、データフレーム cr_loan_prep に加えて、学習用の X_train と y_train が読み込まれています。

指示

100 XP
  • portfolio の最初の5行を出力します。
  • gbt モデルと lr モデルの expected_loss 列を作成し、それぞれ gbt_expected_loss と lr_expected_loss と名付けます。
  • ポートフォリオ全体の lr_expected_loss の合計を出力します。
  • ポートフォリオ全体の gbt_expected_loss の合計を出力します。