1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích Nhân sự (HR Analytics): Dự đoán nghỉ việc bằng Python

Connected

Bài tập

Giới hạn kích thước mẫu

Một cách khác để tránh overfitting là chỉ định số lượng quan sát tối thiểu cần có để mọc một lá (hoặc nút) trong Decision Tree.

Trong bài tập này, bạn sẽ:

  • đặt ngưỡng tối thiểu này là 100
  • fit mô hình mới vào dữ liệu nhân viên
  • xem xét kết quả dự đoán trên cả tập huấn luyện và tập kiểm tra

Các biến features_train, target_train, features_test và target_test đã có sẵn trong không gian làm việc của bạn.

Hướng dẫn

100 XP
  • Khởi tạo DecisionTreeClassifier và đặt ngưỡng tối thiểu cho lá là 100 quan sát
  • Fit mô hình cây quyết định vào dữ liệu huấn luyện.
  • Kiểm tra độ chính xác của dự đoán trên cả tập huấn luyện và tập kiểm tra.