Kepentingan kolom dan prediksi gagal bayar
Saat menggunakan beberapa himpunan latih dengan banyak kelompok kolom yang berbeda, penting untuk memperhatikan kolom mana yang berpengaruh dan mana yang tidak. Memelihara sekumpulan kolom bisa mahal atau memakan waktu, meskipun kolom tersebut mungkin tidak berdampak pada loan_status.
Data X untuk latihan ini dibuat dengan kode berikut:
X = cr_loan_prep[['person_income','loan_int_rate',
'loan_percent_income','loan_amnt',
'person_home_ownership_MORTGAGE','loan_grade_F']]
Latih model XGBClassifier() pada data ini, lalu periksa kepentingan kolom untuk melihat kinerja masing-masing kolom dalam memprediksi loan_status.
Himpunan data cr_loan_pret bersama dengan X_train dan y_train telah dimuat di workspace.
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit dengan Python
Petunjuk latihan
- Buat dan latih model
XGBClassifier()pada himpunan latihX_traindany_train, lalu simpan sebagaiclf_gbt. - Cetak kepentingan kolom untuk kolom-kolom dalam
clf_gbtdengan menggunakan.get_booster()dan.get_score().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create and train the model on the training data
____ = xgb.____().____(____,np.ravel(____))
# Print the column importances from the model
print(clf_gbt.____().____(importance_type = 'weight'))