1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Học có giám sát trong R: Phân loại

Connected

Bài tập

Tạo một cây được cắt tỉa gọn gàng

Dừng việc cho cây phát triển đến tận cùng có thể khiến nó bỏ qua một số khía cạnh của dữ liệu hoặc bỏ lỡ các xu hướng quan trọng mà đáng lẽ về sau mới phát hiện ra.

Bằng cách dùng post-pruning, bạn có thể cố ý nuôi một cây lớn và phức tạp rồi cắt tỉa lại để nhỏ gọn và hiệu quả hơn.

Trong bài này, bạn sẽ có cơ hội dựng một trực quan hóa về hiệu suất của cây so với độ phức tạp, và dùng thông tin đó để cắt tỉa cây đến mức phù hợp.

Gói rpart đã được nạp sẵn, cùng với loans_test và loans_train.

Hướng dẫn

100 XP
  • Dùng tất cả các biến của ứng viên và không dùng pre-pruning để tạo một cây quá phức tạp. Hãy đảm bảo đặt cp = 0 trong rpart.control() để ngăn pre-pruning.
  • Tạo biểu đồ độ phức tạp bằng cách dùng plotcp() trên mô hình.
  • Dựa trên biểu đồ độ phức tạp, cắt tỉa cây về độ phức tạp 0.0014 bằng hàm prune() với cây và tham số độ phức tạp.
  • So sánh độ chính xác của cây đã cắt tỉa với độ chính xác gốc 58.3%. Để tính độ chính xác, hãy dùng các hàm predict() và mean().