1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình hóa rủi ro tín dụng bằng R

Connected

Bài tập

Giảm mô hình thêm nữa?

Khi xóa biến loan_amnt, AUC còn được cải thiện lên 0.6548! Mô hình thu được là

log_4_remove_amnt <- glm(loan_status ~ grade + annual_inc + emp_cat, family = binomial, data = training_set) 

Liệu có thể rút gọn mô hình hồi quy logistic chỉ còn hai biến mà không làm giảm AUC không? Trong bài này bạn sẽ kiểm chứng điều đó!

Hướng dẫn

100 XP
  • Tiếp tục, mỗi lần xóa một biến trong mô hình log_4_remove_amnt. Hãy nhớ bạn đang dùng hàm liên kết mặc định (logit).
  • Dùng predict() để tạo dự đoán xác suất vỡ nợ cho từng mô hình bạn tạo.
  • Tính AUC cho cả ba mô hình, dùng test_set$loan_status làm đối số thứ nhất và các dự đoán của từng mô hình làm đối số thứ hai.
  • Vẽ đường cong ROC cho mô hình có AUC cao nhất trong không gian làm việc của bạn, dùng plot(roc()) với nội dung của roc() giống hệt nội dung bạn dùng cho hàm auc() đạt AUC cao nhất. Lưu ý có thể AUC không thể cải thiện thêm so với mô hình log_4_remove_amnt. Các dự đoán của mô hình này đã được nạp sẵn trong không gian làm việc là pred_4_remove_amnt, phòng trường hợp đây là mô hình cho AUC cao nhất.