1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình hóa Rủi ro Tín dụng bằng Python

Connected

Bài tập

Cross-validation cho mô hình tín dụng

Khoản vay tín dụng và dữ liệu của chúng thay đổi theo thời gian, và không phải lúc nào cũng giống với dữ liệu đã được nạp vào các tập kiểm tra hiện tại. Vì vậy, bạn có thể dùng cross-validation để thử nhiều tập huấn luyện và kiểm tra nhỏ hơn, được lấy từ X_train và y_train gốc.

Dùng hàm cv() của XGBoost để thực hiện cross-validation. Bạn sẽ cần thiết lập tất cả tham số để cv() sử dụng trên dữ liệu kiểm tra.

Các tập dữ liệu X_train, y_train đã được nạp vào môi trường làm việc cùng với mô hình đã huấn luyện gbt, và từ điển tham số params sẽ được in ra khi bài tập tải xong.

Hướng dẫn

100 XP
  • Đặt số lượng folds là 5 và dừng sớm là 10. Lưu lần lượt vào n_folds và early_stopping.
  • Tạo đối tượng ma trận DTrain từ dữ liệu huấn luyện.
  • Dùng cv() với các tham số, số folds, và dừng sớm. Lưu kết quả vào cv_df.
  • In nội dung của cv_df.