1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning trong tidyverse

Connected

Bài tập

Xây dựng mô hình random forest

Tại đây bạn sẽ dùng cùng dữ liệu cross-validation để xây dựng (bằng train) và đánh giá (bằng validate) các random forest cho từng phần chia. Vì bạn đang dùng cùng các phần chia cross-validation như các mô hình hồi quy, bạn có thể so sánh trực tiếp hiệu năng của hai mô hình.

Lưu ý: Chúng ta sẽ giới hạn mỗi random forest ở 100 cây để đảm bảo việc huấn luyện hoàn tất trong thời gian hợp lý. Số cây mặc định của ranger() là 500.

Hướng dẫn

100 XP
  • Dùng ranger() để xây dựng một random forest dự đoán life_expectancy với tất cả đặc trưng trong train cho mỗi phần chia cross-validation.
  • Thêm cột mới validate_predicted dự đoán life_expectancy cho các quan sát trong validate bằng các mô hình random forest bạn vừa tạo.