1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kỹ thuật đặc trưng (Feature Engineering) với R

Connected

Bài tập

Tiền xử lý

Đến giờ làm feature engineering! Bạn cần xây dựng một recipe để xử lý các biến không mang nhiều thông tin nhưng có thể hữu ích như ID quan sát, hoặc xử lý giá trị khuyết. Đây cũng là cơ hội để biến đổi một số biến dự báo: ví dụ, chuẩn hóa các đặc trưng số và tạo biến giả cho các đặc trưng phân loại.

Bộ dữ liệu attrition và các tập chia train và test bạn đã tạo ở bài trước có sẵn trong môi trường của bạn.

Hướng dẫn

100 XP
  • Chuẩn hóa tất cả các đặc trưng số.
  • Bù khuyết giá trị bằng thuật toán nội suy knn.
  • Tạo các biến giả cho tất cả các biến dự báo kiểu danh định.