1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kỹ thuật đặc trưng (Feature Engineering) với R

Connected

Bài tập

Chuẩn hóa và biến đổi log

Bạn được cung cấp bộ dữ liệu attrition_num với dữ liệu số về các nhân viên đã rời công ty. Các đặc trưng bao gồm Age, DistanceFromHome, và MonthlyRate.

Bạn muốn dùng dữ liệu này để xây dựng một mô hình dự đoán khả năng một nhân viên sẽ ở lại, được biểu thị bởi Attrition, một biến nhị phân được mã hóa dạng factor. Để chuẩn bị cho việc xây dựng mô hình, bạn muốn giảm độ lệch phân phối có thể có và ngăn một số biến lấn át các biến khác do khác biệt về thang đo.

Dữ liệu attrition_num và các tập chia train và test đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Chuẩn hóa tất cả biến dự báo dạng số.
  • Biến đổi log tất cả đặc trưng dạng số, với offset bằng 1.