1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình hóa với dữ liệu trong Tidyverse

Connected

Bài tập

Khớp mô hình với dữ liệu huấn luyện

Đến lúc bạn chia dữ liệu thành một tập training để khớp mô hình và một tập test riêng để đánh giá khả năng dự đoán của mô hình. Tuy nhiên, trước khi tách, ta sẽ lấy mẫu 100% số dòng của house_prices không hoàn lại và gán vào house_prices_shuffled. Cách này sẽ “xáo trộn” các dòng, giúp đảm bảo tập training và test được lấy mẫu ngẫu nhiên.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Dùng slice() để đặt train là 10.000 dòng đầu tiên của house_prices_shuffled và test là phần còn lại trong tổng số 21.613 dòng.