1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với caret trong R

Connected

Bài tập

Thử chia 80/20

Bây giờ dữ liệu của bạn đã được xáo ngẫu nhiên, bạn có thể tách 80% đầu tiên thành tập huấn luyện và 20% cuối cùng thành tập kiểm tra. Bạn có thể làm điều này bằng cách chọn một điểm chia xấp xỉ 80% chiều dài dữ liệu:

split <- round(nrow(mydata) * 0.80)

Sau đó dùng điểm này để tách 80% đầu của dữ liệu thành tập huấn luyện:

mydata[1:split, ]

Và dùng chính điểm đó để xác định tập kiểm tra:

mydata[(split + 1):nrow(mydata), ]

Hướng dẫn

100 XP
  • Chọn một chỉ số hàng để chia sao cho điểm chia xấp xỉ 80% độ dài của bộ dữ liệu diamonds. Gọi chỉ số này là split.
  • Tạo một tập huấn luyện tên train dựa trên chỉ số đó.
  • Tạo một tập kiểm tra tên test dựa trên chỉ số đó.