1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình hóa với tidymodels trong R

Connected

Bài tập

Loại bỏ biến dự báo tương quan bằng recipes

Loại bỏ các biến dự báo có tương quan khỏi tập huấn luyện và kiểm thử là một bước feature engineering quan trọng để quá trình huấn luyện mô hình diễn ra trơn tru nhất có thể.

Giờ bạn đã phát hiện monthly_charges và avg_data_gb tương quan cao, bạn cần thêm bộ lọc tương quan với step_corr() vào pipeline feature engineering cho dữ liệu viễn thông.

Trong bài tập này, bạn sẽ tạo một đối tượng recipe để loại bỏ các biến dự báo tương quan khỏi dữ liệu viễn thông.

Các tập dữ liệu telecom_training và telecom_test đã được nạp vào phiên làm việc của bạn.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Tạo một đối tượng recipe, telecom_cor_rec, đặt biến kết quả là canceled_service và tất cả các cột còn lại trong telecom_training là biến dự báo.
  • Thêm một bước tiền xử lý để loại bỏ các biến dự báo có tương quan cao, sử dụng hàm chọn all_numeric() và ngưỡng tương quan 0.8.