1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với caret trong R

Connected

Bài tập

Huấn luyện một random forest

Như bạn đã thấy trong video, các mô hình random forest linh hoạt hơn nhiều so với mô hình tuyến tính: chúng có thể mô hình hóa các hiệu ứng phi tuyến phức tạp và tự động nắm bắt tương tác giữa các biến. Chúng thường cho kết quả rất tốt trên dữ liệu thực tế, nên hãy thử áp dụng vào bộ dữ liệu chất lượng rượu vang, nơi mục tiêu là dự đoán chất lượng (do con người đánh giá) của một mẻ rượu, dựa trên một số thuộc tính hóa học và vật lý được máy đo của mẻ đó.

Việc huấn luyện mô hình random forest hoàn toàn giống với cách bạn đã huấn luyện mô hình hồi quy tuyến tính tổng quát ở chương trước. Bạn chỉ cần đổi đối số method trong hàm train thành "ranger". Gói ranger là bản viết lại của gói randomForest kinh điển của R, huấn luyện nhanh hơn nhiều nhưng cho kết quả gần như giống hệt. Chúng tôi khuyến nghị người mới bắt đầu nên dùng gói ranger cho bài toán mô hình hóa random forest.

Hướng dẫn

100 XP
  • Huấn luyện một random forest tên model trên bộ dữ liệu chất lượng rượu vang wine, trong đó quality là biến phản hồi và tất cả biến còn lại là biến giải thích.
  • Dùng method = "ranger".
  • Dùng tuneLength bằng 1.
  • Dùng 5 fold CV.
  • In model ra console.