1. Learn
  2. /
  3. Courses
  4. /
  5. Phân tích Nhân sự (HR Analytics): Dự đoán nghỉ việc bằng Python

Connected

Exercise

Phát triển và kiểm thử mô hình tốt nhất

Trong Chương 3, bạn phát hiện các tham số sau giúp mô hình tốt hơn:

  • max_depth = 8,
  • min_samples_leaf = 150,
  • class_weight = "balanced"

Ở chương này, bạn thấy rằng một số đặc trưng có tác động không đáng kể. Bạn nhận ra rằng có thể dự đoán chính xác chỉ với một số ít đặc trưng được chọn có ảnh hưởng mạnh và đã cập nhật tập huấn luyện và kiểm tra tương ứng, tạo ra các biến features_train_selected và features_test_selected.

Với tất cả thông tin này, giờ bạn sẽ xây dựng mô hình tốt nhất để dự đoán nghỉ việc của nhân viên và đánh giá nó bằng các thước đo phù hợp.

Các biến features_train_selected và features_test_selected đã có sẵn trong môi trường làm việc của bạn, và các hàm recall_score và roc_auc_score đã được import sẵn.

Instructions

100 XP
  • Khởi tạo mô hình tốt nhất bằng các tham số trong phần mô tả.
  • Fit mô hình chỉ với các đặc trưng đã chọn từ tập huấn luyện.
  • Dự đoán dựa trên các đặc trưng đã chọn từ tập kiểm tra.
  • In ra độ chính xác, recall và điểm ROC/AUC của mô hình.