MulaiMulai sekarang secara gratis

Pohon untuk gagal bayar

Sekarang Anda akan melatih model gradient boosted tree pada data kredit, dan melihat contoh sebagian prediksinya. Apakah Anda ingat saat pertama kali melihat prediksi dari model regresi logistik? Hasilnya tidak bagus. Menurut Anda, apakah model ini akan berbeda?

Data kredit cr_loan_prep, himpunan latih X_train dan y_train, serta data uji X_test tersedia di workspace. Paket XGBoost telah dimuat sebagai xgb.

Latihan ini adalah bagian dari kursus

Pemodelan Risiko Kredit dengan Python

Lihat Kursus

Petunjuk latihan

  • Buat dan latih gradient boosted tree menggunakan XGBClassifier() dan beri nama clf_gbt.
  • Prediksi probabilitas gagal bayar pada data uji dan simpan hasilnya ke gbt_preds.
  • Buat dua data frame, preds_df dan true_df, untuk menyimpan lima prediksi pertama dan nilai loan_status sebenarnya.
  • Gabungkan dan cetak data frame true_df dan preds_df secara berurutan, lalu periksa hasil model.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Train a model
import xgboost as xgb
____ = xgb.____().fit(____, np.ravel(____))

# Predict with a model
____ = clf_gbt.____(____)

# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()

# Concatenate and print the two data frames for comparison
print(pd.____([____.reset_index(drop = True), ____], axis = 1))
Edit dan Jalankan Kode