1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで学ぶクレジットリスクモデリング

Connected

연습 문제

交差検証における限界

極端な回数の交差検証を行いたい場合、nfold と num_boost_round の両方に非常に大きな数を指定できます。データフレーム cv_results_big はすでにワークスペースに読み込まれており、次のコードで作成されています。

cv = xgb.cv(params, DTrain, num_boost_round = 600, nfold=10,
            shuffle = True)

ここでは、cv() が 600 回の交差検証反復を実行しています。パラメータ shuffle は、各回でレコードをシャッフルするよう関数に指示します。

このデータを確認して AUC がどうなっているかを見て、交差検証で 1.0 に到達しているか確かめてください。テスト AUC スコアをプロットして、その推移も確認しましょう。

データフレーム cv_results_big はワークスペースに読み込まれています。

지침

100 XP
  • CV 結果のデータフレームの先頭 5 行を表示します。
  • CV 結果のデータフレームからテストセット AUC の平均を小数第 2 位に丸めて表示します。
  • 各イテレーションにおけるテストセット AUC の推移を折れ線グラフでプロットします。