1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình hóa với tidymodels trong R

Connected

Bài tập

Hoàn thiện pipeline kỹ thuật đặc trưng

Gói recipes được thiết kế để đóng gói nhiều bước kỹ thuật đặc trưng vào một đối tượng duy nhất, giúp bạn dễ dàng quản lý các biến đổi dữ liệu trong quy trình Machine Learning.

Trong bài tập này, bạn sẽ huấn luyện một pipeline kỹ thuật đặc trưng để chuẩn bị dữ liệu viễn thông cho việc xây dựng mô hình.

Bảng telecom_df, cùng với các tập dữ liệu telecom_training và telecom_test từ các bài trước, đã được nạp vào không gian làm việc của bạn.

Hướng dẫn

100 XP
  • Tạo một recipe dự đoán canceled_service bằng tất cả biến dự báo trong dữ liệu huấn luyện.
  • Loại bỏ các biến dự báo tương quan cao với ngưỡng 0.8.
  • Chuẩn hóa tất cả biến dự báo dạng số.
  • Tạo biến giả cho tất cả biến dự báo dạng định danh (nominal).
  • Huấn luyện recipe trên dữ liệu huấn luyện và áp dụng nó lên dữ liệu kiểm tra.