1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình hóa rủi ro tín dụng bằng R

Connected

Bài tập

Cắt tỉa cây với ma trận mất mát

Trong bài tập này, bạn sẽ cắt tỉa cây đã được xây dựng bằng ma trận mất mát để phạt nặng các trường hợp mặc định phân loại sai hơn so với các trường hợp không mặc định phân loại sai.

Hướng dẫn

100 XP
  • Chạy mã để đặt seed và dựng lại tree_loss_matrix.
  • Dùng hàm plotcp() để xem cấu trúc lỗi được kiểm định chéo.
  • Khi xem biểu đồ cp, bạn sẽ thấy rằng cắt tỉa cây theo lỗi kiểm định chéo nhỏ nhất sẽ cho một cây lớn như cây chưa cắt tỉa, vì lỗi kiểm định chéo đạt cực tiểu tại cp = 0.001. Vì bạn muốn làm cây nhỏ hơn một chút, hãy thử cắt tỉa cây với cp = 0.0012788. Với tham số độ phức tạp này, lỗi kiểm định chéo tiến gần tới lỗi nhỏ nhất quan sát được. Đặt tên cây đã cắt tỉa là ptree_loss_matrix.
  • Gói rpart.plot đã được nạp trong không gian làm việc của bạn. Vẽ cây đã cắt tỉa bằng hàm prp() (kèm đối số extra = 1).