1. 학습
  2. /
  3. 강의
  4. /
  5. Machine Learning với Mô hình Dựa trên Cây trong R

Connected

연습 문제

Tạo các fold

Chỉ tách dữ liệu một lần thành tập huấn luyện và tập kiểm tra có những bất ổn về mặt thống kê — vẫn có một khả năng nhỏ là tập kiểm tra của bạn chỉ toàn hạt có điểm cao, còn các hạt điểm thấp lại nằm hết ở tập huấn luyện. Điều này cũng có nghĩa là bạn chỉ có thể đo lường hiệu suất của mô hình một lần.

Cross-validation cho bạn một ước lượng vững hơn về hiệu suất ngoài mẫu mà không gặp các bẫy thống kê — nó đánh giá mô hình của bạn sâu hơn.

Trong bài này, bạn sẽ tạo các fold từ dữ liệu huấn luyện chocolate_train, đã được nạp sẵn.

지침

100 XP
  • Đặt seed bằng 20 để tái lập kết quả.
  • Tạo 10 fold từ chocolate_train và lưu kết quả vào chocolate_folds.