1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xây dựng mô hình phản hồi trong R

Connected

Bài tập

Hiểu về biến giả (dummy variables)

Thị trường bia thủ công cạnh tranh rất khốc liệt. Tăng mức độ hiện diện tại điểm bán thường giúp tăng doanh số. Vì vậy, nhà máy bia sử dụng quảng cáo trưng bày tại điểm bán (point-of-sale). Doanh số theo thể tích của Hoppiness được ghi nhận cho tất cả các tuần có và không có trưng bày.

Bạn nên bắt đầu bằng cách xem xét log(SALES) riêng cho DISPLAY và không DISPLAY. Bạn có thể làm điều này bằng cách dùng hàm aggregate(). Hàm aggregate() cũng có thể hoạt động với biểu thức công thức (formula), giúp việc sử dụng khá tiện. Ở đây, log(SALES) ~ DISPLAY sẽ nhóm log(SALES) theo các mức trong DISPLAY. Đối số hàm FUN áp dụng một hàm chỉ định cho từng mức. Một lần nữa, bạn sẽ tính một số thước đo mô tả đơn giản bằng các hàm mean(), min() và max().

Hướng dẫn

100 XP
  • Tính giá trị trung bình của log(SALES) cho từng mức trong DISPLAY.
  • Tính giá trị nhỏ nhất của log(SALES) cho từng mức trong DISPLAY.
  • Tính giá trị lớn nhất của log(SALES) cho từng mức trong DISPLAY.