1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích Nhân sự (HR Analytics): Dự đoán nghỉ việc bằng Python

Connected

Bài tập

Mã hóa biến phân loại

Bạn cần giúp thuật toán hiểu rằng bạn đang làm việc với các biến phân loại. Bạn sẽ mã hóa các mức của biến salary, vốn là một biến thứ bậc (ordinal) dựa trên các giá trị đã quan sát:

  • trước tiên, bạn phải cho Python biết rằng cột salary thực chất là kiểu phân loại (categorical)
  • sau đó, bạn cần chỉ định đúng thứ tự của các mức
  • cuối cùng, bạn nên mã hóa mỗi mức bằng một giá trị số tương ứng với vị trí của nó trong thứ tự

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Đổi kiểu của cột "salary" sang kiểu phân loại (categorical).