1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với caret trong R

Connected

Bài tập

Dự đoán trên tập kiểm tra

Giờ bạn đã có tập huấn luyện và tập kiểm tra được chia ngẫu nhiên, bạn có thể dùng hàm lm() như ở bài tập đầu để khớp một mô hình trên tập huấn luyện thay vì toàn bộ dữ liệu. Nhớ rằng bạn có thể dùng giao diện công thức của hàm hồi quy tuyến tính để khớp một mô hình với biến đích chỉ định, sử dụng tất cả các biến còn lại trong tập dữ liệu làm biến dự báo:

mod <- lm(y ~ ., training_data)

Bạn có thể dùng hàm predict() để tạo dự đoán từ mô hình đó trên dữ liệu mới. Tập dữ liệu mới phải có đầy đủ các cột như trong dữ liệu huấn luyện, nhưng có thể ở thứ tự khác và có giá trị khác. Ở đây, thay vì dự đoán lại trên tập huấn luyện, bạn sẽ dự đoán trên tập kiểm tra, vốn không được dùng để huấn luyện mô hình. Điều này sẽ giúp bạn xác định sai số ngoài mẫu cho mô hình ở bài tập tiếp theo:

p <- predict(model, new_data)

Hướng dẫn

100 XP
  • Khớp một mô hình lm() tên là model để dự đoán price dùng tất cả biến còn lại làm biến đồng biến. Hãy chắc chắn dùng tập huấn luyện train.
  • Dự đoán trên tập kiểm tra test bằng predict(). Lưu các giá trị này vào một vector tên p.