1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Học có giám sát trong R: Phân loại

Connected

Bài tập

Xây dựng và đánh giá một cây lớn hơn

Trước đó, bạn đã tạo một cây quyết định đơn giản sử dụng điểm tín dụng của người nộp đơn và số tiền vay yêu cầu để dự đoán kết quả khoản vay.

Lending Club có thêm thông tin về người nộp đơn, như tình trạng sở hữu nhà, thâm niên làm việc, mục đích vay và các vụ phá sản trước đây, có thể hữu ích để đưa ra dự đoán chính xác hơn.

Sử dụng tất cả dữ liệu có sẵn của người nộp đơn, hãy xây dựng một mô hình cho vay tinh vi hơn bằng cách dùng tập dữ liệu huấn luyện ngẫu nhiên đã tạo trước đó. Sau đó, dùng mô hình này để dự đoán trên tập dữ liệu kiểm tra nhằm ước lượng hiệu suất của mô hình trên các đơn vay trong tương lai.

Gói rpart đã được nạp sẵn, và các tập dữ liệu loans_train và loans_test đã được tạo.

Hướng dẫn

100 XP
  • Dùng rpart() để xây dựng mô hình khoản vay với tập huấn luyện và tất cả biến dự báo có sẵn. Tiếp tục giữ nguyên đối số control.
  • Áp dụng hàm predict() lên tập kiểm tra để tạo một vector kết quả dự đoán. Đừng quên đối số type.
  • Tạo table() để so sánh giá trị dự đoán với giá trị outcome thực tế.
  • Tính độ chính xác của dự đoán bằng hàm mean().