Kepentingan kolom dan prediksi gagal bayar

Saat menggunakan beberapa himpunan latih dengan banyak kelompok kolom yang berbeda, penting untuk memperhatikan kolom mana yang berpengaruh dan mana yang tidak. Memelihara sekumpulan kolom bisa mahal atau memakan waktu, meskipun kolom tersebut mungkin tidak berdampak pada loan_status.

Data X untuk latihan ini dibuat dengan kode berikut:

X = cr_loan_prep[['person_income','loan_int_rate',
                  'loan_percent_income','loan_amnt',
                  'person_home_ownership_MORTGAGE','loan_grade_F']]

Latih model XGBClassifier() pada data ini, lalu periksa kepentingan kolom untuk melihat kinerja masing-masing kolom dalam memprediksi loan_status.

Himpunan data cr_loan_pret bersama dengan X_train dan y_train telah dimuat di workspace.

Latihan ini merupakan bagian dari kursus

Pemodelan Risiko Kredit dengan Python

Lihat Kursus

Instruksi latihan

Buat dan latih model XGBClassifier() pada himpunan latih X_train dan y_train, lalu simpan sebagai clf_gbt.
Cetak kepentingan kolom untuk kolom-kolom dalam clf_gbt dengan menggunakan .get_booster() dan .get_score().

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Create and train the model on the training data
____ = xgb.____().____(____,np.ravel(____))

# Print the column importances from the model
print(clf_gbt.____().____(importance_type = 'weight'))

Edit dan Jalankan Kode