1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giảm Chiều Dữ Liệu với R

Connected

Bài tập

Tinh chỉnh siêu tham số penalty

Giờ bạn đã thấy tham số penalty ảnh hưởng thế nào đến việc lasso regression chọn đặc trưng, hẳn bạn sẽ hỏi: "Giá trị penalty tốt nhất là gì?" tidymodels cung cấp các hàm để tìm giá trị tốt nhất cho các siêu tham số như penalty.

Trong bài này, bạn sẽ tìm giá trị penalty tốt nhất dựa trên RMSE của mô hình, rồi fit một mô hình cuối cùng với giá trị penalty đó. Cách này sẽ tối ưu việc chọn đặc trưng của lasso regression cho hiệu suất mô hình.

lasso_recipe đã được tạo sẵn cho bạn và train cũng đã có sẵn. Các gói tidyverse và tidymodels cũng đã được nạp.

Hướng dẫn

100 XP
  • Định nghĩa một workflow linear_reg() sẽ tinh chỉnh penalty.
  • Tạo mẫu cross validation 3-fold từ train và một dãy 20 giá trị penalty trong khoảng từ 0.001 đến 0.1.
  • Tạo các mô hình lasso với các giá trị penalty khác nhau.
  • Vẽ biểu đồ hiệu suất mô hình (RMSE) theo giá trị penalty.