1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình hóa rủi ro tín dụng bằng R

Connected

Bài tập

So sánh các hàm liên kết với một ngưỡng cố định

Trong bài tập cuối cùng này, bạn sẽ ước lượng một mô hình với từng hàm liên kết trong ba hàm (logit, probit và cloglog), dự đoán cho tập kiểm tra, phân loại dự đoán vào nhóm phù hợp (vỡ nợ so với không vỡ nợ) với một ngưỡng cho trước, tạo ma trận nhầm lẫn và tính độ chính xác (accuracy) và độ nhạy (sensitivity) cho từng mô hình dựa trên giá trị ngưỡng! Thật tuyệt, đến đây bạn đã học được rất nhiều rồi. Cuối cùng, bạn sẽ cố gắng xác định mô hình nào hoạt động tốt nhất về độ chính xác với giá trị ngưỡng đã cho!

Lưu ý rằng khác biệt giữa các mô hình thường sẽ rất nhỏ, và kết quả phụ thuộc vào ngưỡng được chọn. Kết quả quan sát (vỡ nợ so với không vỡ nợ) được lưu trong true_val trong bảng điều khiển.

Hướng dẫn

100 XP
  • Ước lượng ba mô hình hồi quy logistic lần lượt với các liên kết logit, probit và cloglog. Một phần mã đã được cung cấp. Dùng age, emp_cat, ir_cat và loan_amnt làm biến dự báo.
  • Tạo dự đoán cho tất cả các mô hình trên test_set.
  • Dùng ngưỡng 14% để phân loại dự đoán cho từng mô hình, nhằm đánh giá hiệu năng của chúng.
  • Tạo ma trận nhầm lẫn cho cả ba mô hình.
  • Cuối cùng, tính độ chính xác phân loại cho cả ba mô hình.