MulaiMulai sekarang secara gratis

Putaran pemangkasan lain berdasarkan AUC

Dalam video, Anda melihat bagaimana model regresi logistik "lengkap" dengan tautan logit dipangkas berdasarkan AUC. Anda melihat bagaimana variabel home_ownership dihapus dari model karena meningkatkan AUC secara keseluruhan. Setelah mengulangi proses ini selama dua putaran tambahan, variabel age dan ir_cat dihapus, menghasilkan model:

log_3_remove_ir <- glm(loan_status ~ loan_amnt + grade + annual_inc + emp_cat, family = binomial, data = training_set)

dengan AUC sebesar 0,6545. Sekarang giliran Anda untuk melihat apakah AUC masih dapat ditingkatkan dengan menghapus variabel lain dari model.

Latihan ini adalah bagian dari kursus

Pemodelan Risiko Kredit di R

Lihat Kursus

Petunjuk latihan

  • Hapus satu variabel pada satu waktu dalam model log_3_remove_ir. Ingat bahwa Anda harus menggunakan fungsi tautan bawaan (logit).
  • Buat prediksi probabilitas gagal bayar untuk masing-masing model yang Anda buat.
  • Gunakan fungsi auc() dengan test_set$loan_status sebagai argumen pertama dan prediksi untuk masing-masing dari keempat model sebagai argumen kedua untuk memperoleh AUC untuk setiap model.
  • Salin nama objek (sebagaimana diberikan pada pertanyaan pertama latihan ini) yang mewakili model dengan AUC terbaik.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Build four models each time deleting one variable in log_3_remove_ir
log_4_remove_amnt <- glm(loan_status ~ grade + annual_inc + emp_cat, 
                        family = binomial, data = training_set) 
log_4_remove_grade <-
log_4_remove_inc <- 
log_4_remove_emp <-

# Make PD-predictions for each of the models
pred_4_remove_amnt <- predict(log_4_remove_amnt, newdata = test_set, type = "response")
pred_4_remove_grade <- 
pred_4_remove_inc <-
pred_4_remove_emp <- 

# Compute the AUCs

  
  
Edit dan Jalankan Kode