1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích Nhân sự (HR Analytics): Dự đoán nghỉ việc bằng Python

Connected

Bài tập

Cân bằng các lớp

Điều này có thể ảnh hưởng đáng kể đến kết quả dự đoán, thể hiện qua chênh lệch giữa các điểm recall và accuracy. Để giải quyết mất cân bằng, thường gán trọng số bằng nhau cho mỗi lớp. Bằng cách dùng đối số class_weight trong DecisionTreeClassifier của sklearn, bạn có thể đặt các lớp ở trạng thái "balanced".

Hãy chỉnh lại mô hình bằng cách xử lý vấn đề mất cân bằng:

  • trước hết, bạn sẽ thiết lập một mô hình với các lớp đã được cân bằng
  • sau đó, bạn sẽ khớp mô hình với dữ liệu huấn luyện
  • cuối cùng, bạn sẽ kiểm tra độ chính xác trên tập kiểm tra

Các biến features_train, target_train, features_test và target_test đã có sẵn trong không gian làm việc của bạn.

Hướng dẫn

100 XP
  • Khởi tạo Decision Tree Classifier, cắt tỉa cây của bạn bằng cách giới hạn độ sâu tối đa là 5, và cân bằng trọng số lớp.
  • Khớp mô hình mới.
  • In score độ chính xác của dự đoán (tính theo phần trăm) cho tập kiểm tra.