1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giảm Chiều Dữ Liệu với R

Connected

Bài tập

Tạo workflow kết hợp recipe và model

Gói tidymodels có thể kết hợp recipe và model thành workflow. Workflow giúp bạn dễ dàng tạo một chuỗi bước để chuẩn bị dữ liệu và huấn luyện mô hình. Sau đó, workflow có thể áp dụng cho dữ liệu mới một cách thuận tiện, mà không cần định nghĩa lại toàn bộ các bước tiền xử lý và xây dựng mô hình. Thuận tiện hơn nữa, workflow có hàm fit() để fit cả recipe và model vào dữ liệu.

Trong bài tập này, bạn sẽ luyện cách tạo một recipe và một model rồi thêm chúng vào một workflow, để sẵn sàng fit vào dữ liệu. Bộ dữ liệu chăm sóc sức khỏe nhân viên về nghỉ việc (employee healthcare attrition) đã được chia sẵn thành tập train và test cho bạn sử dụng. Biến mục tiêu là Attrition.

Các gói tidyverse và tidymodels đã được nạp sẵn.

Hướng dẫn

100 XP
  • Định nghĩa một recipe dùng dữ liệu train với step_filter_missing(), step_scale(), và step_nzv() để lần lượt loại NAs, chuẩn hóa các đặc trưng số, và loại bỏ các đặc trưng có phương sai thấp. Dùng ngưỡng 0.5 cho step_filter_missing().
  • Định nghĩa một mô hình hồi quy logistic dùng engine "glm".
  • Thêm feature_selection_recipe và lr_model vào một workflow tên attrition_wflow.