1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình hóa rủi ro tín dụng bằng R

Connected

Bài tập

Một vòng tỉa biến nữa dựa trên AUC

Trong video, bạn đã thấy mô hình hồi quy logistic “đầy đủ” với liên kết logit được tỉa biến dựa trên AUC. Bạn đã thấy biến home_ownership được xóa khỏi mô hình vì nó cải thiện AUC tổng thể. Sau khi lặp lại quy trình này thêm hai vòng nữa, các biến age và ir_cat được xóa, dẫn tới mô hình:

log_3_remove_ir <- glm(loan_status ~ loan_amnt + grade + annual_inc + emp_cat, family = binomial, data = training_set)

với AUC là 0.6545. Giờ đến lượt bạn kiểm tra xem AUC còn có thể cải thiện được nữa không bằng cách xóa thêm một biến khỏi mô hình.

Hướng dẫn

100 XP
  • Lần lượt xóa một biến trong mô hình log_3_remove_ir. Hãy nhớ bạn nên dùng hàm liên kết mặc định (logit).
  • Tạo dự đoán xác suất vỡ nợ cho từng mô hình bạn đã tạo.
  • Dùng hàm auc() với test_set$loan_status là đối số thứ nhất và các dự đoán cho từng mô hình trong bốn mô hình là đối số thứ hai để lấy AUC cho mỗi mô hình.
  • Sao chép tên đối tượng (như đã nêu ở câu hỏi đầu tiên của bài tập này) đại diện cho mô hình có AUC tốt nhất.