1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning trong tidyverse

Connected

Bài tập

Các data frame cho cross-validation

Bây giờ bạn đã giữ lại một phần dữ liệu làm testing data, bạn có thể dùng phần còn lại để tìm mô hình hoạt động tốt nhất.

Trong bài này, bạn sẽ chia training data thành một loạt 5 bộ train-validate bằng hàm vfold_cv() từ gói rsample.

Hướng dẫn

100 XP
  • Tạo một data frame cho cross validation 5-fold từ training_data bằng vfold_cv() và gán vào cv_split.
  • Chuẩn bị cv_data bằng cách thêm hai cột mới vào cv_split:
    • train: chứa các data frame train bằng cách ánh xạ training() qua cột splits.
    • validate: chứa các data frame validate bằng cách ánh xạ testing() qua cột splits.