1. Учиться
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶクレジットリスクモデリング

Connected

Exercise

信用モデルのクロスバリデーション

クレジットローンとそのデータは時間とともに変化し、現在のテストセットに読み込まれているものと常に同じとは限りません。そこで、元の X_train と y_train から作られた、より小さな学習・テストセットを複数試すためにクロスバリデーションを使います。

XGBoost の関数 cv() を使ってクロスバリデーションを実行してください。テストデータで使うために、cv() のパラメータをすべて設定する必要があります。

ワークスペースにはデータセット X_train、y_train、学習済みモデル gbt、そして演習の読み込み時に表示されるパラメータ辞書 params が用意されています。

Инструкции

100 XP
  • 分割数を 5、早期終了を 10 に設定し、それぞれ n_folds、early_stopping として保存します。
  • 学習データを使って行列オブジェクト DTrain を作成します。
  • params、分割数、早期終了のオブジェクトを指定して cv() を実行し、結果を cv_df に保存します。
  • cv_df の中身を出力します。