1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Học có giám sát trong R: Phân loại

Connected

Bài tập

Xây dựng cây quyết định đơn giản

Bộ dữ liệu loans gồm 11.312 người được chọn ngẫu nhiên đã nộp đơn và sau đó nhận khoản vay từ Lending Club, một công ty cho vay ngang hàng tại Mỹ.

Bạn sẽ dùng cây quyết định để học các mẫu trong kết quả của những khoản vay này (hoặc được hoàn trả, hoặc vỡ nợ) dựa trên số tiền vay được yêu cầu và điểm tín dụng tại thời điểm nộp đơn.

Sau đó, xem dự báo của cây khác nhau thế nào giữa một người nộp đơn có tín dụng tốt và một người có tín dụng xấu.

Các bộ dữ liệu loans, good_credit và bad_credit đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Nạp gói rpart.
  • Khớp một mô hình cây quyết định với hàm rpart().
    • Truyền công thức R xác định outcome là hàm của loan_amount và credit_score làm đối số thứ nhất.
    • Tạm thời giữ nguyên đối số control. (Bạn sẽ học thêm về nó sau!)
  • Dùng predict() với mô hình khoản vay nhận được để dự đoán kết quả cho ứng viên good_credit. Dùng đối số type để dự đoán "class" của kết quả.
  • Làm tương tự cho ứng viên bad_credit.