1. Learn
  2. /
  3. Courses
  4. /
  5. Xử lý dữ liệu khuyết bằng Imputation trong R

Connected

Exercise

Đánh đổi giữa tốc độ và độ chính xác

Trong video vừa rồi, bạn đã thấy có hai nút điều chỉnh có thể tinh chỉnh để ảnh hưởng đến hiệu năng của random forests:

  • Số lượng cây quyết định trong mỗi forest.
  • Số lượng biến được dùng để chia trong các cây quyết định.

Tăng mỗi yếu tố có thể cải thiện độ chính xác của mô hình bù khuyết (imputation), nhưng cũng sẽ tốn nhiều thời gian chạy hơn. Trong bài tập này, bạn sẽ tự khám phá các ý tưởng đó bằng cách chạy missForest() trên dữ liệu biopics hai lần với các thiết lập khác nhau. Khi làm theo hướng dẫn, hãy chú ý đến các lỗi bạn in ra và thời gian mã chạy.

Instructions 1/2

undefined XP
  • 1
    • Chạy missForest() trên biopics với 5 cây quyết định và 2 biến dùng để chia, rồi in ra lỗi bù khuyết (imputation error).
  • 2
    • Chạy missForest() trên biopics với 50 cây quyết định và 6 biến dùng để chia, rồi in ra lỗi bù khuyết (imputation error).