1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình hóa với tidymodels trong R

Connected

Bài tập

Thứ tự của các hàm step_*()

Các hàm step_*() trong một recipe được thực thi theo thứ tự tuần tự. Điều này rất quan trọng để bạn tránh các kết quả ngoài ý muốn trong pipeline feature engineering!

Trong bài tập này, bạn sẽ kết hợp các hàm step_*() khác nhau vào một recipe và xem việc thay đổi thứ tự các hàm step_*() ảnh hưởng thế nào đến kết quả cuối cùng.

Bộ dữ liệu telecom_training và telecom_test đã được nạp trong phiên làm việc này.

Hướng dẫn 1/4

undefined XP
  • 1
    • Xác định đối tượng telecom_recipe_1 để chuẩn hóa tất cả biến dự báo dạng số và sau đó tạo biến giả cho tất cả biến dự báo danh mục trong dữ liệu huấn luyện telecom_training.
    • Chọn cột theo vai trò (role) trong phần khai báo recipe.
  • 2
    • Huấn luyện telecom_recipe_1 và dùng nó để biến đổi dữ liệu kiểm tra telecom_test.
  • 3
    • Bây giờ hãy xác định telecom_recipe_2 để tạo biến giả cho tất cả biến dự báo danh mục và sau đó chuẩn hóa tất cả biến dự báo dạng số trong dữ liệu huấn luyện telecom_training.
    • Chọn cột theo vai trò (role) trong phần khai báo recipe.
  • 4
    • Huấn luyện telecom_recipe_2 và dùng nó để biến đổi dữ liệu kiểm tra telecom_test.