1. Học hỏi
  2. /
  3. Dự An
  4. /
  5. Phân tích nhân sự: Dự đoán nghỉ việc bằng R

Connected

Bài tập

Chia dữ liệu

Trong bài tập này, bạn sẽ chia dữ liệu thành tập huấn luyện và tập kiểm tra bằng gói caret. Ở các bài tiếp theo, bạn sẽ dùng tập huấn luyện để xây dựng các mô hình hồi quy logistic và dùng tập kiểm tra để kiểm định các mô hình này.

Hướng dẫn

100 XP
  • Nạp gói caret.
  • Đặt seed là 567 và tạo một phần chia dữ liệu để tách emp_final thành các phần huấn luyện/kiểm tra theo tỷ lệ 70% / 30%.
  • Tạo tập huấn luyện bằng cách chọn các số dòng được lưu trong index_train từ bộ dữ liệu emp_final.
  • Gán các quan sát còn lại của emp_final cho tập kiểm tra.