Pohon untuk gagal bayar
Sekarang Anda akan melatih model gradient boosted tree pada data kredit, dan melihat contoh sebagian prediksinya. Apakah Anda ingat saat pertama kali melihat prediksi dari model regresi logistik? Hasilnya tidak bagus. Menurut Anda, apakah model ini akan berbeda?
Data kredit cr_loan_prep, himpunan latih X_train dan y_train, serta data uji X_test tersedia di workspace. Paket XGBoost telah dimuat sebagai xgb.
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit dengan Python
Petunjuk latihan
- Buat dan latih gradient boosted tree menggunakan
XGBClassifier()dan beri namaclf_gbt. - Prediksi probabilitas gagal bayar pada data uji dan simpan hasilnya ke
gbt_preds. - Buat dua data frame,
preds_dfdantrue_df, untuk menyimpan lima prediksi pertama dan nilailoan_statussebenarnya. - Gabungkan dan cetak data frame
true_dfdanpreds_dfsecara berurutan, lalu periksa hasil model.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Train a model
import xgboost as xgb
____ = xgb.____().fit(____, np.ravel(____))
# Predict with a model
____ = clf_gbt.____(____)
# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()
# Concatenate and print the two data frames for comparison
print(pd.____([____.reset_index(drop = True), ____], axis = 1))