1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với Mô hình Dựa trên Cây trong R

Connected

Bài tập

Hiệu suất in-sample và out-of-sample

Liệu một mô hình phức tạp hơn lúc nào cũng cho kết quả tốt hơn? Như đã trao đổi trong video, đó chỉ đúng một nửa.

Mô hình bị overfit nắm rất rõ cấu trúc của tập huấn luyện nhưng lại không khái quát hóa tốt sang dữ liệu mới. Thật đáng tiếc! Suy cho cùng, mục tiêu chính của một mô hình dự báo là hoạt động tốt trên dữ liệu mới, đúng không? Hãy kiểm chứng điều đó!

Đã được nạp sẵn mô hình cuối cùng của bài trước, complex_model, cùng với dữ liệu huấn luyện và kiểm tra của bạn (chocolate_train và chocolate_test).

Hướng dẫn 1/2

undefined XP
  • 1
    • Dùng complex_model để dự đoán điểm của tập huấn luyện, thêm các dự đoán này vào dữ liệu huấn luyện gốc và tính mean absolute error.
  • 2
    • Điều chỉnh mã của bạn để dự đoán điểm của tập kiểm tra, thêm các dự đoán này vào dữ liệu kiểm tra gốc và tính mean absolute error.