1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶクレジットリスクモデリング

Connected

演習

列の重要度と延滞(デフォルト)予測

多くの列グループを含む複数の訓練データを使う場合、どの列が重要で、どの列が重要でないかを把握しておくことが大切です。loan_status に影響しないのに列を維持し続けるのは、コストや時間がかかることがあります。

この演習の X データは次のコードで作成されています。

X = cr_loan_prep[['person_income','loan_int_rate',
                  'loan_percent_income','loan_amnt',
                  'person_home_ownership_MORTGAGE','loan_grade_F']]

このデータに対して XGBClassifier() モデルを学習し、列の重要度を確認して、各列が loan_status の予測にどの程度効いているかを確かめてください。

cr_loan_pret データセットと X_train、y_train はワークスペースに読み込まれています。

指示

100 XP
  • X_train と y_train の訓練データで XGBClassifier() モデルを作成・学習し、clf_gbt として保存します。
  • .get_booster() と .get_score() を使って、clf_gbt の列に対する重要度を表示します。