Pohon untuk gagal bayar
Sekarang Anda akan melatih model gradient boosted tree pada data kredit, dan melihat contoh sebagian prediksinya. Apakah Anda ingat saat pertama kali melihat prediksi dari model regresi logistik? Hasilnya tidak bagus. Menurut Anda, apakah model ini akan berbeda?
Data kredit cr_loan_prep, himpunan latih X_train dan y_train, serta data uji X_test tersedia di workspace. Paket XGBoost telah dimuat sebagai xgb.
Latihan ini merupakan bagian dari kursus
Pemodelan Risiko Kredit dengan Python
Instruksi latihan
- Buat dan latih gradient boosted tree menggunakan
XGBClassifier()dan beri namaclf_gbt. - Prediksi probabilitas gagal bayar pada data uji dan simpan hasilnya ke
gbt_preds. - Buat dua data frame,
preds_dfdantrue_df, untuk menyimpan lima prediksi pertama dan nilailoan_statussebenarnya. - Gabungkan dan cetak data frame
true_dfdanpreds_dfsecara berurutan, lalu periksa hasil model.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Train a model
import xgboost as xgb
____ = xgb.____().fit(____, np.ravel(____))
# Predict with a model
____ = clf_gbt.____(____)
# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()
# Concatenate and print the two data frames for comparison
print(pd.____([____.reset_index(drop = True), ____], axis = 1))