1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kỹ thuật đặc trưng (Feature Engineering) với R

Connected

Bài tập

Dự đoán đặt phòng khách sạn

Bạn vừa nhận việc tại một công ty nghiên cứu ngành lưu trú, và nhiệm vụ đầu tiên là xây dựng một mô hình dự đoán liệu một kỳ lưu trú tại khách sạn có trẻ em đi cùng hay không. Để huấn luyện mô hình, bạn sẽ dùng phiên bản đã được chỉnh sửa của bộ dữ liệu nhu cầu đặt phòng khách sạn của Antonio, Almeida, và Nunes (2019). Bạn giới hạn dữ liệu vào các đặc trưng sau:

features <- c('hotel', 'adults', 
              'children', 'meal',
              'reserved_room_type', 
              'customer_type', 
              'arrival_date')

Dữ liệu đã được nạp sẵn vào đối tượng hotels, kèm theo hai tập test và train tương ứng, và mô hình đã được khai báo là lr_model <- logistic_reg().

Bạn sẽ đánh giá hiệu suất mô hình bằng accuracy và diện tích dưới đường cong ROC (AUC).

Hướng dẫn 1/2

undefined XP
    1
    2
  • Tạo các đặc trưng "day of the week", "week" và "month".
  • Tạo biến giả (dummy) cho tất cả các biến dự báo dạng phân loại.