1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning trong tidyverse

Connected

Bài tập

Chuẩn bị các phần train-test-validate

Trong bài tập này, bạn sẽ tận dụng các công cụ đã học để xây dựng một mô hình phân loại dự đoán nghỉ việc của nhân viên.

Bạn sẽ làm việc với bộ dữ liệu attrition, chứa 30 đặc trưng về nhân viên mà bạn sẽ dùng để dự đoán họ có rời công ty hay không.

Trước tiên, bạn sẽ chuẩn bị các tập dữ liệu huấn luyện và kiểm tra, sau đó tiếp tục chia nhỏ dữ liệu huấn luyện bằng cross-validation để có thể tìm ra mô hình hoạt động tốt nhất cho bài toán này.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Chia dữ liệu của bạn thành 75% huấn luyện và 25% kiểm tra bằng hàm initial_split().
  • Trích xuất các data frame huấn luyện và kiểm tra từ data_split lần lượt bằng training() và testing().