1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python 信用风险建模

Connected

演習

交叉验证测试的局限

如果您想进行非常大量的交叉验证,可以为 nfold 和 num_boost_round 指定非常大的数值。数据框 cv_results_big 已经加载到工作区,并通过以下代码创建:

cv = xgb.cv(params, DTrain, num_boost_round = 600, nfold=10,
            shuffle = True)

这里,cv() 进行了 600 次交叉验证迭代!参数 shuffle 告诉函数每次都打乱记录。

请查看这些数据以了解 AUC 的取值,并检查在交叉验证中它们是否达到 1.0。您还应绘制测试集 AUC 分数的图,观察其随迭代的变化过程。

数据框 cv_results_big 已加载到工作区。

指示

100 XP
  • 打印交叉验证结果数据框的前 5 行。
  • 打印交叉验证结果数据框中测试集 AUC 的平均值,并四舍五入到小数点后 2 位。
  • 绘制测试集 AUC 随每次迭代变化的折线图。