1. Lära sig
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶクレジットリスクモデリング

Connected

exercise

延滞確率の予測

すべてのデータ前処理が完了し、いよいよ延滞確率の予測を作成します。LogisticRegression() モデルを学習させて、延滞確率の予測がどのように得られるかを確認しましょう。

predict_proba が出力する内容を具体的に理解するために、予測された延滞確率とサンプルのレコードを並べて見てみます。最初の5件の予測は、実際の loan_status と比べてどう見えるでしょうか?

データセット cr_loan_prep に加え、X_train、X_test、y_train、y_test はすでにワークスペースに読み込まれています。

Instruktioner

100 XP
  • 学習データでロジスティック回帰モデルを学習し、clf_logistic として保存してください。
  • テストデータに対して predict_proba() を用いて予測を作成し、preds に保存してください。
  • 先頭5件の予測値と実際の loan_status を保持するデータフレーム preds_df と true_df を作成してください。
  • .concat() を使って、true_df と preds_df を1つにまとめて表示してください。