1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích Nhân sự (HR Analytics): Dự đoán nghỉ việc bằng Python

Connected

Bài tập

Xác định biến phân loại

Biến phân loại là các biến chỉ nhận một số lượng giá trị hữu hạn mô tả một nhóm hoặc hạng mục. Chúng có hai loại:

  • Thứ bậc (Ordinal) – biến có từ hai hạng mục trở lên và có thể sắp xếp/đánh thứ tự (ví dụ: “thấp”, “trung bình”, “cao”)
  • Định danh (Nominal) – biến có từ hai hạng mục trở lên và không có thứ tự nội tại (ví dụ: “nam”, “nữ”)

Trong bài tập này, bạn sẽ tìm các biến phân loại trong bộ dữ liệu. Để làm được, trước hết bạn sẽ import thư viện pandas và đọc tệp CSV có tên "turnover.csv". Sau đó, sau khi xem 5 hàng đầu tiên và nhận thấy (bằng mắt) rằng có các giá trị không phải số trong DataFrame, bạn sẽ lấy một số thông tin về các kiểu biến có trong bộ dữ liệu.

Hướng dẫn

100 XP
  • Import pandas (đặt bí danh pd) để đọc dữ liệu.
  • Đọc tệp "turnover.csv" và lưu vào một DataFrame tên data.
  • Xem nhanh 5 hàng đầu tiên của dữ liệu.
  • Lấy một ít thông tin info() về các kiểu biến trong dữ liệu.