Putaran pemangkasan lain berdasarkan AUC
Dalam video, Anda melihat bagaimana model regresi logistik "lengkap" dengan tautan logit dipangkas berdasarkan AUC. Anda melihat bagaimana variabel home_ownership dihapus dari model karena meningkatkan AUC secara keseluruhan. Setelah mengulangi proses ini selama dua putaran tambahan, variabel age dan ir_cat dihapus, menghasilkan model:
log_3_remove_ir <- glm(loan_status ~ loan_amnt + grade + annual_inc + emp_cat, family = binomial, data = training_set)
dengan AUC sebesar 0,6545. Sekarang giliran Anda untuk melihat apakah AUC masih dapat ditingkatkan dengan menghapus variabel lain dari model.
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit di R
Petunjuk latihan
- Hapus satu variabel pada satu waktu dalam model
log_3_remove_ir. Ingat bahwa Anda harus menggunakan fungsi tautan bawaan (logit). - Buat prediksi probabilitas gagal bayar untuk masing-masing model yang Anda buat.
- Gunakan fungsi
auc()dengantest_set$loan_statussebagai argumen pertama dan prediksi untuk masing-masing dari keempat model sebagai argumen kedua untuk memperoleh AUC untuk setiap model. - Salin nama objek (sebagaimana diberikan pada pertanyaan pertama latihan ini) yang mewakili model dengan AUC terbaik.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Build four models each time deleting one variable in log_3_remove_ir
log_4_remove_amnt <- glm(loan_status ~ grade + annual_inc + emp_cat,
family = binomial, data = training_set)
log_4_remove_grade <-
log_4_remove_inc <-
log_4_remove_emp <-
# Make PD-predictions for each of the models
pred_4_remove_amnt <- predict(log_4_remove_amnt, newdata = test_set, type = "response")
pred_4_remove_grade <-
pred_4_remove_inc <-
pred_4_remove_emp <-
# Compute the AUCs