Membuat model yang lebih diskriminatif
Pada latihan sebelumnya, rentang probabilitas gagal bayar yang diprediksi cukup kecil. Seperti dibahas, probabilitas gagal bayar yang kecil memang wajar ketika tingkat gagal bayar rendah, tetapi membangun model yang lebih besar (yang pada dasarnya berarti: memasukkan lebih banyak prediktor) dapat memperluas rentang prediksi Anda.
Apakah hal ini pada akhirnya akan menghasilkan prediksi yang lebih baik masih perlu divalidasi dan bergantung pada kualitas prediktor yang baru dimasukkan. Namun terlebih dahulu, perhatikan bagaimana model yang lebih besar dapat memperluas rentangnya.
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit di R
Petunjuk latihan
- Buat
log_model_fulldengan cara yang sama seperti Anda membuatlog_model_small, tetapi kali ini, sertakan semua prediktor yang tersedia dalam himpunan data. Jika Anda tidak ingin mengetik nama setiap kolom satu per satu, Anda dapat memilih semua variabel denganloan_status ~ . - Buat vektor prediksi
predictions_all_fulluntuk semua kasus dalam himpunan uji menggunakanpredict(). Perhatikan bahwa nilai-nilai ini merepresentasikan probabilitas gagal bayar. - Lihat rentang dari prediksi tersebut.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Change the code below to construct a logistic regression model using all available predictors in the data set
log_model_small <- glm(loan_status ~ age + ir_cat, family = "binomial", data = training_set)
# Make PD-predictions for all test set elements using the the full logistic regression model
# Look at the predictions range