1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giảm Chiều Dữ Liệu với R

Connected

Bài tập

Tạo mô hình random forest đầy đủ

Mô hình random forest tự nhiên thực hiện chọn đặc trưng khi chúng xây nhiều cây con từ các tập con ngẫu nhiên của đặc trưng. Một cách để hiểu tầm quan trọng của đặc trưng là xây một mô hình rồi trích xuất độ quan trọng của đặc trưng. Vì vậy, trong bài tập này, bạn sẽ dùng dữ liệu Healthcare Job Attrition để huấn luyện một mô hình phân loại rand_forest() mà từ đó bạn có thể trích xuất độ quan trọng của đặc trưng. Để có thể lấy được độ quan trọng của đặc trưng, hãy tạo mô hình với importance = "impurity". Các tập train và test đã được cung cấp cho bạn.

Các gói tidyverse, tidymodels, và vip đã được nạp sẵn.

Hướng dẫn

100 XP
  • Định nghĩa một mô hình random forest phân loại với 200 cây để có thể trích xuất độ quan trọng của đặc trưng.
  • Fit mô hình random forest với tất cả các biến dự báo.
  • Gắn (bind) các dự đoán vào tập test.
  • Tính chỉ số F1.