1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kỹ thuật đặc trưng (Feature Engineering) với R

Connected

Bài tập

Sàng lọc theo mức độ quan trọng của biến

Bộ dữ liệu attrition có 839 quan sát và 30 biến dự báo cho "Attrition." Bạn muốn khám phá đánh đổi giữa hiệu năng của một mô hình dùng tất cả biến dự báo hiện có so với một mô hình rút gọn dựa trên một vài biến giàu thông tin.

Trong bài tập này, bạn sẽ fit một mô hình và xem mức độ quan trọng của các biến trong mô hình đã fit. Ở bài tập tiếp theo, bạn sẽ đánh giá hiệu năng mô hình này so với một mô hình rút gọn.

Các tập train và test cùng gói vip() đã có sẵn trong môi trường của bạn, kèm theo một model hồi quy logistic đã được khai báo trước.

Hướng dẫn

100 XP
  • Tạo một recipe mô hình hóa Attrition bằng tất cả biến dự báo.
  • Fit workflow lên dữ liệu huấn luyện.
  • Dùng đối tượng fit_full để vẽ biểu đồ mức độ quan trọng của biến trong mô hình của bạn.
  • Áp dụng hàm extract_fit_parsnip() trước vip() để cung cấp thông tin cần thiết cho nó.