1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xây dựng mô hình phản hồi trong R

Connected

Bài tập

Chọn lọc (Subsetting)

Hãy nhớ rằng công ty muốn mở rộng kinh doanh và cung cấp Hoppiness trên toàn quốc. Do đó, mô hình cũng cần hoạt động tốt trên dữ liệu lấy từ các cửa hàng mới. Một cách để kiểm tra mô hình của bạn hoạt động thế nào trên dữ liệu mới là trước tiên huấn luyện mô hình trên một phần dữ liệu, rồi thử dự đoán phần dữ liệu còn lại.

Bạn tạo một tập dữ liệu huấn luyện bằng cách loại bỏ lần mua cuối cùng được ghi nhận cho mỗi khách hàng. Bạn có thể làm điều này bằng cách dùng hàm subset() trên choice.data và chọn tất cả các quan sát có biến chỉ báo LASTPURCHASE bằng 0. Tương tự, bạn tạo tập dữ liệu kiểm tra bằng cách chọn tất cả các quan sát có biến chỉ báo LASTPURCHASE bằng 1.

Hướng dẫn

100 XP
  • Bỏ lần mua cuối cùng để tạo tập dữ liệu huấn luyện. Dùng hàm subset() trên choice.data. Chỉ định LASTPURCHASE == 0 làm đối số subset. Gán kết quả cho train.data.
  • Tạo tập dữ liệu kiểm tra bằng cách dùng hàm subset() trên choice.data. Chỉ định LASTPURCHASE == 1 làm đối số subset. Gán kết quả cho test.data.