1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Pythonで学ぶクレジットリスクモデリング

Connected

Bài tập

延滞分類レポート

モデルの評価をさらに詳しく見ていきます。ここでは、デフォルト確率のしきい値を設定し、分類レポートを通じてモデルの性能を分析します。

確率のデータフレームを作っておくと、pandas の機能を活用できて扱いやすくなります。データにしきい値を適用し、loan_status の両クラスについて値の件数を確認して、それぞれの予測が何件生成されているかを把握しましょう。これは、分類レポートのスコアを読み解く助けになります。

cr_loan_prep データセット、学習済みロジスティック回帰 clf_logistic、真のローンステータス y_test、および予測確率 preds はワークスペースに読み込まれています。

Hướng dẫn

100 XP
  • preds からデフォルト確率のみのデータフレーム preds_df を作成します。
  • preds_df のデフォルト確率に対してしきい値 0.50 を用い、loan_status を再割り当てします。
  • 各 loan_status の行数を値の件数として出力します。
  • y_test と preds_df を用いて分類レポートを出力します。