1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình hóa rủi ro tín dụng bằng R

Connected

Bài tập

Đường cong ROC để so sánh các mô hình hồi quy logistic

Bạn có thể tạo đường cong ROC rất dễ dàng bằng gói pROC trong R. Hãy xem liệu có khác biệt lớn nào giữa các đường cong ROC của bốn mô hình hồi quy logistic đã sử dụng xuyên suốt khóa học này không. Lưu ý nhỏ:

  • predictions_logit chứa các dự đoán xác suất vỡ nợ (PD) dùng liên kết logit mặc định và bao gồm các biến age, emp_cat, ir_cat và loan_amnt.
  • predictions_probit chứa dự đoán PD dùng probit và bao gồm các biến age, emp_cat, ir_cat và loan_amnt.
  • predictions_cloglog chứa dự đoán PD dùng liên kết cloglog và bao gồm các biến age, emp_cat, ir_cat và loan_amnt.
  • predictions_all_full chứa dự đoán PD dùng liên kết logit mặc định và bao gồm cả bảy biến trong bộ dữ liệu.

Trước tiên, bạn sẽ vẽ các đường cong ROC cho bốn mô hình này trên cùng một biểu đồ. Sau đó, bạn sẽ xem diện tích dưới đường cong.

Hướng dẫn

100 XP
  • Nạp gói pROC trong R-console của bạn.
  • Tạo các đối tượng ROC cho bốn mô hình hồi quy logistic bằng hàm roc(response, predictor). Nhớ rằng response là chỉ báo trạng thái khoản vay trong test_set, có thể lấy bằng test_set$loan_status.
  • Dùng các đối tượng đã tạo để vẽ các đường cong ROC. Để vẽ tất cả trên cùng một biểu đồ, dùng plot() cho đường ROC đầu tiên (cho ROC_logit), và dùng [lines()](https://www.rdocumentation.org/packages/graphics/functions/lines to add the ROC-curves) để thêm đường cong ROC của ba mô hình còn lại vào cùng biểu đồ.
  • Dùng đối số col để đổi màu đường cong của ROC_probit thành "blue", ROC_cloglog thành "red" và ROC_all_full thành "green". Lưu ý rằng, khác với nội dung đã thảo luận trong video, nhãn trục x là Specificity chứ không phải "1-Specificity", dẫn đến trục chạy từ 1 ở phía bên trái xuống 0 ở phía bên phải.
  • Có vẻ như hàm liên kết không ảnh hưởng nhiều đến ROC trong trường hợp này; yếu tố chính giúp ROC tốt hơn là đưa thêm biến vào mô hình. Để có cái nhìn chính xác về hiệu năng của các đường ROC, hãy xem AUC bằng hàm auc().