MulaiMulai sekarang secara gratis

Validasi silang model kredit

Pinjaman kredit dan datanya berubah seiring waktu, dan tidak selalu tampak seperti yang dimuat ke dalam himpunan uji saat ini. Oleh karena itu, Anda dapat menggunakan validasi silang untuk mencoba beberapa himpunan pelatihan dan uji yang lebih kecil yang diturunkan dari X_train dan y_train asli.

Gunakan fungsi XGBoost cv() untuk melakukan validasi silang. Anda perlu menyiapkan semua parameter yang akan digunakan cv() pada data uji.

Himpunan data X_train, y_train telah dimuat di workspace bersama model terlatih gbt, dan kamus parameter params yang akan tercetak saat latihan dimuat.

Latihan ini adalah bagian dari kursus

Pemodelan Risiko Kredit dengan Python

Lihat Kursus

Petunjuk latihan

  • Atur jumlah lipatan menjadi 5 dan penghentian dini menjadi 10. Simpan sebagai n_folds dan early_stopping.
  • Buat objek matriks DTrain menggunakan data pelatihan.
  • Gunakan cv() pada parameter, lipatan, dan objek penghentian dini. Simpan hasilnya sebagai cv_df.
  • Cetak isi cv_df.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Set the values for number of folds and stopping iterations
____ = ____
____ = ____

# Create the DTrain matrix for XGBoost
____ = xgb.____(____, label = ____)

# Create the data frame of cross validations
____ = xgb.cv(____, ____, num_boost_round = 5, nfold=____,
            early_stopping_rounds=____)

# Print the cross validations data frame
____(____)
Edit dan Jalankan Kode