1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giảm Chiều Dữ Liệu với R

Connected

Bài tập

Tách tập train và test

Bước đầu tiên khi huấn luyện mô hình là chia dữ liệu thành các tập train và test. Gói tidymodels giúp việc này trở nên dễ dàng. Dành riêng một tập dữ liệu test cho phép bạn đánh giá mô hình đã huấn luyện trên dữ liệu mà mô hình chưa từng thấy.

Bạn sẽ dùng dữ liệu nghỉ việc trong lĩnh vực chăm sóc sức khỏe, chứa thông tin về nhân viên của một công ty healthcare và việc họ có rời công ty hay không. Dữ liệu có sẵn trong attrition_df. Biến đích là Attrition.

Các gói tidyverse và tidymodels đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Khởi tạo phép chia dữ liệu với 80% cho huấn luyện và phân tầng theo Attrition, biến đích.
  • Trích xuất tập huấn luyện và lưu vào train.
  • Trích xuất tập kiểm tra và lưu vào test.