1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với caret trong R

Connected

Bài tập

Cross-validation 5 x 5-fold

Bạn có thể làm nhiều hơn một vòng cross-validation. Lặp lại cross-validation sẽ cho bạn ước lượng tốt hơn về lỗi trên tập kiểm tra. Bạn cũng có thể lặp lại toàn bộ quy trình cross-validation. Cách này tốn thời gian hơn, nhưng cho bạn nhiều bộ dữ liệu ngoài mẫu hơn để quan sát và các đánh giá chính xác hơn nhiều về mức độ hiệu quả của mô hình.

Một trong những điều tuyệt vời về hàm train() trong caret là việc chạy các mô hình rất khác nhau hoặc các phương pháp cross-validation chỉ bằng cách điều chỉnh một vài tham số đơn giản trong lời gọi hàm. Ví dụ, bạn có thể lặp lại toàn bộ quy trình cross-validation của mình 5 lần để tăng độ tin cậy cho ước lượng về độ chính xác ngoài mẫu của mô hình, ví dụ:

trControl = trainControl(
  method = "repeatedcv", 
  number = 5,
  repeats = 5, 
  verboseIter = TRUE
)

Hướng dẫn

100 XP
  • Huấn luyện lại mô hình hồi quy tuyến tính trên bộ dữ liệu nhà ở Boston.
  • Dùng 5 lần lặp của cross-validation 5-fold.
  • In mô hình ra console.