1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giảm Chiều Dữ Liệu với R

Connected

Bài tập

Chuẩn hóa dữ liệu cho lasso regression

Để sẵn sàng huấn luyện mô hình lasso regression, việc chuẩn hóa dữ liệu là quan trọng để mọi đặc trưng có thể so sánh được với nhau. Toàn bộ dữ liệu giao dịch nhà ở tại King County, California có trong house_sales_df.

Trong bài tập này, bạn sẽ chuẩn hóa biến mục tiêu price riêng trước khi chia dữ liệu thành tập huấn luyện và tập kiểm tra. Lý do là vì cách tidymodels xử lý recipes. Chúng ta không đưa các phép biến đổi của biến mục tiêu vào recipe.

Các gói tidyverse và tidymodels đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Chuẩn hóa biến mục tiêu price trong house_sales_df bằng scale().
  • Tạo tập huấn luyện và tập kiểm tra với 80% dữ liệu thuộc tập huấn luyện.
  • Tạo recipe sử dụng dữ liệu huấn luyện để chuẩn hóa tất cả các biến dự báo dạng số.