1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với Mô hình Dựa trên Cây trong R

Connected

Bài tập

Đánh giá các fold

Giờ bạn đã huấn luyện 10 mô hình bằng 10 fold và tính MAE và RMSE cho từng mô hình, đã đến lúc trực quan hóa mức độ lớn của các sai số. Cách này giúp bạn hình dung phân phối lỗi ngoài mẫu, rất hữu ích để đánh giá chất lượng mô hình.

Bạn sẽ vẽ biểu đồ histogram cho tất cả các lỗi này và hiển thị các thống kê tóm tắt trên toàn bộ các fold.

Kết quả của bài trước, fits_cv, đã được nạp sẵn.

Hướng dẫn

100 XP
  • Thu thập lỗi ngoài mẫu của tất cả mô hình trong fits_cv bằng một hàm duy nhất của yardstick và lưu thành all_errors.
  • Tạo biểu đồ histogram ggplot2 với .estimate làm thuộc tính thẩm mỹ x và tô màu (fill) các cột theo .metric.
  • Dùng lại hàm ở bước đầu với summarize = TRUE để hiển thị các thống kê tóm tắt của fits_cv.