1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kỹ thuật đặc trưng (Feature Engineering) với R

Connected

Bài tập

Bù khuyết dữ liệu và tạo biến giả (dummy)

Sau khi phát hiện giá trị thiếu trong bộ dữ liệu attrition và xác định rằng chúng thiếu hoàn toàn ngẫu nhiên (MCAR), bạn quyết định dùng phương pháp bù khuyết K Nearest Neighbors (KNN). Khi cấu hình recipe cho feature engineering, bạn quyết định tạo các biến giả cho tất cả các biến định tính (nominal) và cập nhật vai trò của biến ...1 thành "ID" để có thể giữ nó trong bộ dữ liệu làm tham chiếu mà không ảnh hưởng đến mô hình.

Hướng dẫn

100 XP
  • Cập nhật vai trò của ...1 thành "ID".
  • Bù khuyết giá trị cho tất cả các biến dự báo có dữ liệu bị thiếu.
  • Tạo biến giả cho tất cả các biến dự báo định tính.