Validasi silang model kredit
Pinjaman kredit dan datanya berubah seiring waktu, dan tidak selalu tampak seperti yang dimuat ke dalam himpunan uji saat ini. Oleh karena itu, Anda dapat menggunakan validasi silang untuk mencoba beberapa himpunan pelatihan dan uji yang lebih kecil yang diturunkan dari X_train dan y_train asli.
Gunakan fungsi XGBoost cv() untuk melakukan validasi silang. Anda perlu menyiapkan semua parameter yang akan digunakan cv() pada data uji.
Himpunan data X_train, y_train telah dimuat di workspace bersama model terlatih gbt, dan kamus parameter params yang akan tercetak saat latihan dimuat.
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit dengan Python
Petunjuk latihan
- Atur jumlah lipatan menjadi
5dan penghentian dini menjadi10. Simpan sebagain_foldsdanearly_stopping. - Buat objek matriks
DTrainmenggunakan data pelatihan. - Gunakan
cv()pada parameter, lipatan, dan objek penghentian dini. Simpan hasilnya sebagaicv_df. - Cetak isi
cv_df.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Set the values for number of folds and stopping iterations
____ = ____
____ = ____
# Create the DTrain matrix for XGBoost
____ = xgb.____(____, label = ____)
# Create the data frame of cross validations
____ = xgb.cv(____, ____, num_boost_round = 5, nfold=____,
early_stopping_rounds=____)
# Print the cross validations data frame
____(____)