1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning cho Phân tích Marketing bằng R

Connected

Bài tập

Dữ liệu cho phân tích sống sót (survival analysis)

Trong các bài tập sau, bạn sẽ làm việc với dữ liệu về khách hàng của một cửa hàng trực tuyến để luyện tập survival analysis. Nhưng lần này không phải thời gian đến khi rời bỏ (churn), mà là thời gian đến đơn hàng thứ hai.

Dữ liệu được lưu trong đối tượng dataNextOrder. Biến boughtAgain nhận giá trị 0 cho khách hàng chỉ có một đơn và 1 cho khách hàng đã đặt đơn thứ hai. Nếu một người đã đặt hàng lần thứ hai, bạn sẽ thấy số ngày giữa đơn đầu tiên và đơn thứ hai trong biến daysSinceFirstPurch. Với khách hàng chưa có đơn thứ hai, daysSinceFirstPurch chứa thời gian kể từ đơn hàng đầu tiên (và gần nhất) của họ.

Gói ggplot2 đã được nạp vào không gian làm việc của bạn.

Hướng dẫn

100 XP
  • Xem nhanh dữ liệu bằng head().
  • Vẽ biểu đồ histogram của số ngày kể từ lần mua đầu tiên, tách riêng cho nhóm có và không có đơn hàng thứ hai. (Nếu bạn chưa quen với mã ggplot2, đừng lo: Bạn chỉ cần dùng daysSinceFirstPurch làm biến trục x và boughtAgain làm biến tô màu và phân ô.)