Membuat model yang lebih diskriminatif
Pada latihan sebelumnya, rentang probabilitas gagal bayar yang diprediksi cukup kecil. Seperti dibahas, probabilitas gagal bayar yang kecil memang wajar ketika tingkat gagal bayar rendah, tetapi membangun model yang lebih besar (yang pada dasarnya berarti: memasukkan lebih banyak prediktor) dapat memperluas rentang prediksi Anda.
Apakah hal ini pada akhirnya akan menghasilkan prediksi yang lebih baik masih perlu divalidasi dan bergantung pada kualitas prediktor yang baru dimasukkan. Namun terlebih dahulu, perhatikan bagaimana model yang lebih besar dapat memperluas rentangnya.
Latihan ini merupakan bagian dari kursus
Pemodelan Risiko Kredit di R
Instruksi latihan
- Buat
log_model_fulldengan cara yang sama seperti Anda membuatlog_model_small, tetapi kali ini, sertakan semua prediktor yang tersedia dalam himpunan data. Jika Anda tidak ingin mengetik nama setiap kolom satu per satu, Anda dapat memilih semua variabel denganloan_status ~ . - Buat vektor prediksi
predictions_all_fulluntuk semua kasus dalam himpunan uji menggunakanpredict(). Perhatikan bahwa nilai-nilai ini merepresentasikan probabilitas gagal bayar. - Lihat rentang dari prediksi tersebut.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Change the code below to construct a logistic regression model using all available predictors in the data set
log_model_small <- glm(loan_status ~ age + ir_cat, family = "binomial", data = training_set)
# Make PD-predictions for all test set elements using the the full logistic regression model
# Look at the predictions range