1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với caret trong R

Connected

Bài tập

Cross-validation 5-fold

Trong khóa học này, bạn sẽ dùng nhiều bộ dữ liệu khác nhau để khám phá toàn bộ sự linh hoạt của gói caret. Ở đây, bạn sẽ dùng bộ dữ liệu nhà ở Boston nổi tiếng, với mục tiêu dự đoán giá trị trung vị của nhà ở các vùng ngoại ô Boston.

Bạn có thể dùng chính xác cùng đoạn mã như ở bài tập trước, chỉ cần thay bộ dữ liệu mà mô hình sử dụng:

model <- train(
  medv ~ ., 
  Boston, # <- new!
  method = "lm",
  trControl = trainControl(
    method = "cv", 
    number = 10,
    verboseIter = TRUE
  )
)

Tiếp theo, bạn có thể giảm số lượng folds trong cross-validation từ 10 xuống 5 bằng tham số number của hàm trainControl():

trControl = trainControl(
  method = "cv", 
  number = 5,
  verboseIter = TRUE
)

Hướng dẫn

100 XP
  • Khớp một mô hình lm() với bộ dữ liệu nhà ở Boston, trong đó medv là biến phản hồi và tất cả các biến còn lại là biến giải thích.
  • Sử dụng cross-validation 5-fold thay vì 10-fold.
  • In mô hình ra console và xem xét kết quả.